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(57) Abstract 

Up until now, a central and global unit 
have been integrated into one module which 
processes all of die configuration requests. The 
invention provides for a plurality of active units 
which can take over ^is task. These units 
are arranged in a hjerarchy. A request from 
the lowest level isyonly transferred to the next 
highest level if the request cannot be processed. 
The highest level is connected to an internal 
or external higher-order configuration memory 
which contains all the configuration data ever 
required for this programme run. The tree 
structure of the configuration units enables a 
kind of cacheing of the configuration data. The 
configurations are mainly accessed locally. In 
the worst case scenario, a configuration has to 
be loaded from the higher-order configuration 
memory in case the relative data are not available in any of the CTs (configuration tables) in the hierarchy. 
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(57) Zusammenfassung 

Anstatt wie bisher eine zentrale urid globale Einheit in einen Baustein zu integrieren, wclche alle Konfigurations-Anforderungen 
bearbeitet, existieren nun eine Mehrzahl von hicrarchisch angeordneten aktiven Einheiten,. welche diese Aufgabe ubemehmen kdnnen. 
Dabei wild cine Ajrfbrderung von dcr tiefsten Ebene nur dann an die nachst hoher gelegene Ebene weitergeleitet, wenn die 
Anfoidening nicht bearbeitet werden konnte. Die hochst gelegene Ebene ist an einen intemen oder externen ubergeprdneten 
konfijgurationsspeicher angeschlossen, der alle jemals fur diesen Programmlauf benotigten Konfigurationsdaten enthait Durch die 
Baumstruktur der Konfigurationseinheiten wird cine Art Cacheing der Konfigurationsdaten erreicht Zugriffe auf Konfigurationen finden 
hauptsachlich lokal start Im ungQnstigsten Fall muss eine Konfiguration aus dem ubergeordneten Konfigurationsspeicher geladen werden, 
tails die betreffenden Dateri i iri keiner der hierarchisch angeordneten CTs vorhanden sind. 
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Verfahren zum hierarchischen Cachen von 
Konf igurationsdaten von Datenf lufiprozessoren und 
Bausteinen mi.t zwei- oder mehrdimensionaler 
programmierbarer Zellstruktur (FPGAs, DPGAs, o.dgl.) 

Hint ergrund der Erfindung 
Stand der Technik 

Der Stand der Technik, welcher diese Patentschrift 
zugrunde liegt, ist durch die Patentanmeldung 196 54 
846.2-53 (Verfahren zum selbstandigen dynamischen 
Umladen von Datenf luBprozessoren (DFPs) sowie Bausteinen 
mit zwei- oder mehrdimensionaler programmierbaren 
Zellmatrix (FPGAs, DPGAs , o.dgl.) und der 
Patentanmeldung 196 54 593.5-53 (Umkonf igurierungs 
Verfahren fur programmierbare Bausteine zur Laufzeit) 
beschrieben. Darin wird ein Verfahren zur Konf iguration 
und Umkonf iguration von DFPs, sowie FPGAs, DPGAs und 
ahnlichen Bausteinen nach dem Stand der Technik, 
beschrieben, bei dem ein separat ausgestalteter zentral 
tibergeordheter Mikrokontroller-ahnlicher Baustein die 
Verteilung von Konf igurationsdaten an mehrere 
untergeordnete, weitgehend passive Steuereinheiten 
ubernimmt . 

Probleme 

Durch den Einsatz einer zentralen und globalen Einheit, 

welche die Rekonf iguration von Teilen (z.B. Zellen 

(CELs)) eines oder mehrerer Bausteine steuert, kommt es 

zu Engpassen, wenn viele verschiedene Rekonf igurations- 
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Anfragen auf einmal behandelt werden miissen. Die 
Vorteile der Parallelitat, der beschriebenen Bausteine, 
wird durch eine sblche zentrale Einheit stark 
eingeschrankt, da sie den typischen "Flaschenhals". 
darstellt und die Verarbeitung. der Daten dadurch 
erheblich verlangsamt . 

Weiterhin ist die Zuordnung der Ereignisqueile zu der zu 
ladenden Konf iguration problematisch, da mit absoluten 
Adressen des Konf igurationsspeichers gearbeitet wird. 
Die Rekonf igurations-Einheit muB also eine Art 
Speicherverwaltungssystem beinhalten, welche, ahnlich 
wie in einem Betriebssystem, mitprptokolliert, welche 
Speicherbereich von welcher Konf ig;uratiqn benutzt 
werden . 

Ein zusatzliches Problem stellt die Verwaltung der 
Resourcen (z.B. CELs) dar. Es mufl sichergestellt sein, 
dafi jede CEL nur genau einmal an einen von einer 
Rekonfigurationsanfrage gestartetem Algorithmus vergeben 
wird und zwar denjenigen der auch die restlichen 
umliegenden CEL verwendet, da ansonsten Deadlocks 
auftreten konnen. 

Urn die Problematik der Umkonf iguration nochmals zu 
verdeutlichen wird folgendes Beispiel gegeben: 
Eine Matrix aus CELs ist unkonf iguriert und im RESET- 
Zustand. Jede CEL ist in der Lage anzuzeigen, ob sie 
sich in einem umkonf igurierbaren Zustand befindet, Alle 
CELs in der Matrix sihd bereit konf iguriert zu werden; 
befinden sich also in einem umkonf igurierbaren Zustand. 
Eine erste Konf igurationsroutine (KR1) wird geladen, 
wobei die Matrix nicht vollstandig benutzt wird. Die 
konfigurierten CELs heben die Anzeige, da6 sie sich in 
einem konf igurierbaren Zustand befinden auf. In eine 
Gruppe der noch nicht konfigurierten CELs wird eine 
zweite, von der Ersten unabhangigen, 
Konf igurationsroutine (KR2) geladen. Eine dritte 
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Konfiguration kann nicht geladen werden, da diese CELs 
der ersten und/oder zweiten Konf igurationsroutine (KR3) 
benotigt, die sich aber in keinem umkonf igurierbaren 
Zustand befinden, da sie beniitzt werden. 
KR3 mufl so lange angehalten werden, bis die benotigten 
CEL freigegeben wurden, d.h. KR1 und KR2 terminiert 
haben . 

Wahrend der Ausfiihrung von KR1 und KR2 koirant eine 
Ladeanforderung fur eine vierte Konf igurationsroutine 
(KR4) und eine funfte Konf igurationsroutine (KR5) hinzu, 
die alle nicht sofort geladen werden kdnnen, da sie CELs 
benutzen,. die von KR1 und KR2 verwendet werden. KR3 und 
KR4 benutzen teilweise die selben CELs, KR5 benutzt 
keine der CELs von KR3 und KR4 . 

Urn KR3-5 ordentlich nachzuladen existieren folgende 
Forderungen: 

1. KR3-5 sollen so geladen werden, dafl die zeitliche 
Reihenfolge gemafi den Ladeanf orderungen moglichst 
beibehalten wird. 

2. Moglichst viele KR die unabhangig von einander sind, 
also keine gemeinsamen CELs besitzen, sollen geladen 
werden, urn ein Hochstmafi an Parallelitat zu erhalten. 

3. Die KRs durfen sich nicht gegenseitig blockieren, 
d.h. KR3 1st teilweise geladen, kann jedoch nicht weiter 
geladen werden, da andere CELs durch die teilweise 
geladene KR4 blockiert sind; wahrend KR4 auch nicht 
weiter geladen werden kann, da wiederum benotigte CELs 
durch KR3 blockiert sind. Dies fiihrt zu einer typische 
Deadlock-Situation . 

4. Dem Compiler, der die KRs generiert hat ist es nicht 
moglich das zeitliche Zusairanenspiel der KRs zu erkennen 
und so auf zulosen, daA es zu keiner Konf liktsituatibn . 
kommt . 
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Dabei soil das Verhaltnis zwischen den Aufwand fiir eine 
zu realisierende Schaltung und eines opt irnalen 
Ergebnisses moglichst gut sein, d.h* Ziel der Erfindung 
ist es mit moglichst geringem Aufwand eine flexible, 
paralleled- Deadlockr-f reie Konf iguration zu ^ ermoglichen, 
die mit wenig Zeit- und Rechenaufwand durchgefuhrt 
werden kann. Dabei miissen folgende Grundprobleme gelost 
werden: 

- Wurde nur KR3 geladen werden, ware das Verfahren 
Deadlock-frei, doch ; nicht optimal, da auch KR5 geladen 
werden konnte. 

.- Wird KR3 geladen, KR4 nicht, jedoch KR5 muft KR4 so 
vorgemerkt werden, dafi es bei einem nachf olgenden 
Ladevorgang die hochste Prioritat besitzt, was einen 
hohen Verwaltungsaufwand bedeutet. 

Die Deadlockfreiheit ist durch das nachfolgend 
beschriebene Verfahren gegeben: 

Verbesserung durch die Erfindung, Aufgabe 

Die Grundaufgabe der vorliegenden Erfindung ist eine 
Einheit - im folgenden Konf igurationstabelle (CT) 
genannt die hierarchisch aufgebaut ist und auf jeder 
Ebene mehrfach vorkommen kann, wobei sich die Zahl der 
CTs von der untersten Hierarchiestufe zur obersten so 
verringert, daB auf der hochsten Ebene genau eine CT 
vbrhanden ist. JedeCT konf igurieft und kontrolliert 
unabhangig von anderen und parallel eine Mehrzahl von 
konfigurierbaren Elementen (CELs) . CTs hoherer 
Hierarchiestufen konnen Konf igurationsroutinen fiir 
tieferliegende CTs zwischenspeichern . Benotigen mehrere 
der tieferliegenden CTs ein und dieselbe 
Konfigurationsroutine, wird diese bei einer 
hoherliegenden CT zwischengespeichert und von den 
einzelnen CTs abgerufen, wobei die hoherliegende CT die 
betreffende Konfigurationsroutine nur ein Mai aus einem 
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globalen geme ins amen Konf igurationsspeicher abruft, 
wodurch ein Cache-Effekt erzielt wird. Abseits. 
konf igurierbarer Bausteine kann die vorliegende 
Erfindung ais Cachevef fahren fur Instructions- und 
Datencache in Mikroprozessoren, DFP oder dgl. mit . . 
mehreren Rechenwerken eingesetzt werden. Dabei konnen, 
je nach Anwendung, einige der im folgenden beschriebenen 
Einheiten entfallen (z.B. FILMO) , am hierarchischen 
Aufbau andert sich jedoch grundlegend nichts. Deshalb 
wird dieser Einsatz als . ein.e Teilmenge betrachtet und 
nicht weiter darauf eingegangen. Ein erheblicher Vorteil 
des beschriebenen Verf ahrens gegeniiber gewohnlichen 
Cacheverfahren ist, daI5 Daten und/oder Code selektiv, . 
d.h. anhand vori exakt auf den Algorithmus abgestimmten 
Methoden gecached werden. 

Ebenfalls ermoglicht die vorliegende Erfindung das 
vollstandig deadlockf reie Umkonf igurieren von groften 
Zellstrukturen . 

Beschreibung der Erfindung 

Anstatt wie bisher eine zentrale und globale Einheit in 
einen Baustein zu integrieren, welche alle 
Konfigurations-Anforderungen bearbeitet, exist ieren nun 
eine Mehrzahl von hierarchisch (Baumstruktur) 
angeordneten aktiven Einheiten, welche diese Aufgabe 
ubernehmen konnen. 

Dabei wird eine Anforderung von der tiefesten Ebene (den 
Blattern in der Hierarchie) nur dann an die nachst hoher 
gelegene Ebene weitergeleitet, wenn die Anforderung 
nicht bearbeitet werden konnte. Diese Schritte werden 
fur alle vorhandenen Ebenen wiederholt, bis die hochst 
gelegene Ebene erreicht ist. 

Die hochst gelegene Ebene ist an . einen internen oder 
externen ubergeordneten Konf igurationspeicher 
angeschlossen, der alle jemals fur diesen Programlauf, 
benotigten Konf igurationsdaten enthalt . 
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Durch die Baumstruktur der Konf igurationseinheiten wird 
eine Art Cacheing der Konf igurationsdaten erreicht. 

. Zugrif fe auf Konf igurationen finden hauptsachlich lokal 
sta'tt. Tin ungunstigsten Fall muss eine Konf iguration aus 
den ubergeordneten Konf igurationsspeicher geladen ... 
werden, falls die betref fenden Daten in keiner der 
hierarchisch angeordneten CTs vorhanden sind. 
Deadlocks werden verhindert, indem eine feste zeitliche 
Abfolge der zu ladenden Konf igurationen eingefuhrt wird 

:und die Konf igurationen zu einer Liste zusammengef afct 
werden. Die Statusinf ormationen der CEL werden vor dem 

.Laden gesichert und bleiben dadurch wahrend des 
Abarbeitens der gesamten Liste von Konf igurationen 
unverandert. 

Die Grundlagen der CT 

Eine Konfigurationstabelle (CT) ist eine aktive Einheit, 
die auf Synchronisationssignale, sogenannten Trigger, 
reagiert. Die Trigger werden von einer zwei- oder 
mehrdimensionalen Matrix aus elektronischen Baugruppen, 
fiir gewohnlich arithmentischen oder logischen Einheiten, 
Adressgeneratoren, Recheneinheiten f o.a. - im folgenden 
konfigurierbare Elemente (CEL) genannt - generiert. 
Anhand des . auftretenden Trigger wird eine bestimmte 
Aktion innerhalb der CT ausgelost. Dabei ist.es Aufgabe 
der CT die Steuerung einer Mehrzahl von CELs zu 
uberhehmen und deren arithmetischen und/oder logischen 
Operationen zu bestimmen. Insbesondere mussen CELs 
konfiguriert und umkonf iguriert werden. Diese Aufgabe 
ubernimmt eine CT, indem sie eine Mehrzahl von moglichen 
Konf igurationsroutinen (KR) , die ihrerseits jeweils aus 
einer Mehrzahl von einzelnen Konf igurationsworten (KW) 
bestehen, verwaltet und eine Mehrzahl von CELs aufgrund 
von Triggerbedingungen mit einer oder mehrerer der KR 
konfigurieren. Dabei erhalt eine CEL jeweils eines oder 
mehrere der Konf igurationsworte, die mit der Adresse der 
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zu konfigurierenden CEL versehen sind. Eine KR muft dabei 
vollstandig und korrekt auf eine Mehrzahl von CELs 
abgebildet werden, wobei mehrere CELs zu Gruppen 
zusammerigefaftt sein korinen; die mi t jeweils 
unterschiedlichen, aber vollstandig. ausgefiihrten KRs 
konfiguriert werden, Dabei sind alle CELs in einer 
Gruppe so verschaltet, daft nach Feststellung einer 
notwendigen Umkonf igurierung alle gruppierten CELs durch 
ein gemeinsames Signal (ReConfig) mitgeteilt wird, daft 
jede CEL die Datenverarbeitung zu beenden und in einen. 
umkonf igurierbaren Zustand iiberzugehen hat. 

Grundlagen der deadlockfreien Umkonf igurat ion 

Bei zur Laufzeit umkonf igurierbaren Systemen tritt das 
Problem auf, daft das System in einen Zustand gelangen 
kann, in dem jeweils zwei Teile aufeinander warten und 
somit eine Deadlock Situation eingetreten ist. 

Dieses Problem konnte vermieden werden, indem eine neue 
Konfiguration immer nur ganz oder gar nicht in das 
System geladen wird, oder eine Art Timeout-Verf ahren 
eingesetzt wird. 

Dadurch entstehen ein Reihe von Nachteilen (benotigter 
Platz, Laufzeit etc.) und Problemen, wie zum Beispiel: 

- Vorgehen, falls eine Konfiguration nicht geladen 
werden kann ... 

- Verwaltung der Reihenfolge, in der die Konf igurationen 
geladen werden 

- Performance Einbruch, da andere Konf igurationen, 
welche eventuell in die CELs geladen werden konnten, 
nicht beachtet werden. 

Mit dem folgend beschriebenen Verfahren konnen diese 
Probleme beseitigt werden. Es wird von einem DFP System 
nach dem Stand der Technik ausgegangen. 
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Von einer CEL aus, wird ein Trigger-Signal an eine CT. 
gesendet. Diese CT stellt die Triggerquelle fest und 
wahlt durch eine Look-Up Tabelle eine zu ladende 
Konf iguration (KR) aus . Die eingehenden Triggersignale 
werden gesperrt, es werden keine weiteren Trigger bis 
zur kompletten Abarbeitung der aktuellen Konf iguration 
akzeptiert. Eine Konf iguration besteht aus mehreren 
Befehlen, welche an eine Menge von CELs ubertragen wird. 
In einem zur Laufzeit konf igurierbaren System ist. 
allerdings nicht sichergestellt f daft jeder 
Konfigurations-Befehl (KW) auch ausgeflihrt werden kann. 
Dies kann zum Beispiel daran scheitern, daft das. 
adressierte konf igurierbare Element (CEL) seine Aufgabe 
noch nicht beendet hat und somit keine neuen 
Konfigurationsdaten entgegen nehmen kann. Urn einen 
Performance Einbruch zu verhindern, werden alle 
Konfigurationsbefehle, welche nicht abgearbeitet werden 
konnten (da sich die entsprechenden CELs in einem nicht 
umkonf igurierbaren Zustand befanden und die 
Konf iguration ablehnten (REJECT) ) , entsprechend eines 
FIFOs hinter den letzten sich in einem (nachfolgend 
naher beschrieben) speziellen Speicher (FILMO) 
befindenden Konf igurationsbefehl geschrieben. Danach 
wird der nachsten Konf igurationsbefehl, nach dem 
gleichen Verfahren, abgearbeitet . Dies wiederholt sich 
solange, bis das Ende einer Konf iguration . erreicht 
wurde. 

Danach geht die CT, wieder in den Zustand uber, in dem 
sie Trigger-Signale akzeptiert, urn eventuell weiter 
Konfigurationen zu laden. In diesem Zustand arbeitet die 
CT den FILMO in regelmaMgen Abstanden, durch einen 
Zeitgeber gesteuert, ab. 
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Eine Priorisierung der zu ladenden Konf igurationen wird 
erreicht, .in dem die CT den Speicher FILMO durchlauf t ,. 
bevor die eigentlich zu ladende Konf iguration bearbeitet 
wird. Diirch eine FIFO-ahniiche Struktur des FILMO wird 
sichergestellt, . daft KW.s,. ; welche wahrend vorhergehenden 
Triggeranforderungen nicht vollstandig abgearbeitet 
werden konnten, automatisch eine hohere Prioritat vor 
den neu abzuarbeitenden WK erhalten. Bei der Abarbeitung 
des Speichers (FILMO) wird jedes durch einen 
Konf igurationsbefehl adressierte konf igurierbare Element 
(CEL) vor oder wahrende des Sendens eines KWs getestet, 
ob es sich irri Zustand "umkonf igurierbar" befindet. 1st 
dieser Zustand "umkonf igurierbar" (ACCEPT) , werden die 
Daten iibertragen und aus dem Speicher FILMO geloscht. 
1st der Zustand "nicht umkonf igurierbar" (REJECT) , 
bleiben die Daten im FILMO und werden beim nachsten 
Durchlauf erneut abgerarbeitet - Die CT verarbeitet den 
nachsten Eintrag im FILMO. 

Dies wiederholt sich solange, bis das Ende des FILMO 
erreicht ist. Danach wird die eigentliche, durch das 
Auftreten des Trigger-Signals aktivierte Konf iguration 
abgearbeitet. Der Aufbau des FILMOs entspricht dabei dem 
FIFO Prinzip, das he'iflt, es werden die altesten Eintrage 
zuerst verarbeitet. Urn den FILMO auch abzuarbeiten, wenn 
keine neue KR geladen wird, wird der FILMO von einem 
Timer gesteuert in regelmaMgen Abstanden durchlauf en. 

Die iibrigen, nicht beteiligten konf igurierbaren Elemente 
(CEL) arbeitet wahrend dieser Phase parallel weiter und 
wird nicht in ihrer Funktion beeinflufit. Dadurch kann 
der Fall eintreten, dafl wahrend die CT den FILMO 
abarbeitet, eine oder mehrere konf igurierbaren Elemente 
(CELs) in den Zustand "umkonf igurierbar" ubergehen. Da 
die CT sich mit der Abarbeitung an einer beliebigen 
Stelle innerhalb des FILMOs befinden kann, konnte 
folgender Fall eintreten: 
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Die CT versucht einen ersten Befehl abzuarbeiten dessen 
adressiertes konf igurierende Element (CEL) sich nicht in 
dem Zustand "umkonf igurierbar" befindet. Die CT fahrt 
somit nut dem nachsten Befehl . (KW) fort . -Zur selben Zeit 
gehen ein oder mehrere konf iguri.erbaren Element e in den 
Zustand "umkonf igurierbar" iiber, darunter auch das 
konf igurierbare Element, welches durch den ersten 
Konfigurationsbefehl hatte beschrieben werden konnen. 
Die CT verarbeitet einen zweiten Konfigurationsbefehl 

(KW) , welcher das gleiche konf igurierbare Element. (CEL) 
benutzt, wie der erste Konfigurationsbefehl, allerdings 
aus einer . anderen Konf iguration stamrrtt • Zu diesem 
Zeitpunkt, befindet sich das konf igurierbare Element 

(CEL) in dem Zustand "umkonf igurierbar M und der Befehl 
kann erfolgreich abgerarbeitet werden. 

Dadurch ist nicht mehr sichergestellt , daft die 
Konfiguration, welche zuerst geladen werden sollte, auch 
tatsachlich zuerst fertiggestellt wird. Es konnen nun 
zwei teilweise fertige Konf igurationen existieren, 
welche jeweils konf igurierbare Elemente der anderen 
Konfiguration benotigen, urn vollstandig geladen zu 
werden. Eine Deadlock-Situation ist eingetreten, die in 
Figur 18 verdeutlicht wird. Konfiguration A und 
Konfiguration B sollen konfiguriert werden. Die CT hat 
den schraf f ierten Teil von Konfiguration A und 
Konfiguration B bereits geladen. Konfiguration A 
benotigt zur Fertigstellung noch den hell-doppelt 
schraf f ierten Bereich von Konfiguration B, und 
Konfiguration B benotigt zur Fertigstellung noch den 
dunkel-doppelt schraf fierten Bereich von Konfiguration 
A. Da beide Konf igurationen noch nicht vollstandig 
abgeschlossen sind, und somit auch nicht f unktionsf ahig, 
tritt fur keine der beiden Konf igurationen der 
Terminierungszustand ein, in dem eine der 
beiden Konf igurationen entfernt wurde. Beide 
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Konfigurationen warten darauf, daft die noch bendtigten 
konf igurierbaren Elemente freigegeben werden. 

In dem. vorliegendeh Verf ahren wird ein Deadlock 
verhindert> indem die CT.vor der Abarbeitung des FILMOs 
die Zustande aller konf igurierbarer Elemente erfaftt und 
danach bis zur Beendigung des Vorgangs keine Anderungen 
mehr zulaftt, bzw. auftretende Anderungen ignoriert. Mit 
anderen Worten, es werden entweder die Zustande aller 
konf igurierbaren Elemente vor der Abarbeitung des FILMOs 
gesichert oder eine Veranderung der Zustande wahrend der 
Abarbeitung des FILMOs verhindert . Eine -mogliche . 
technische Ausfiihrung 1st der Einsatz eines Registers, in 
jedem konf igurierbaren Element, in das der Zustand vor 
Abarbeitung des FILMOs gesichert wird. Die CT arbeitet 
nur auf Basis der erfafcten Zustanden und nicht mit den 
aktuellen Zustanden der konf igurierbaren Elemente. 
Dadurch ist sichergestellt , daft jeder zu bearbeitende 
Befehl (KW) den gleichen Zustand der konf igurierbaren 
Elemente (CELs) vorf indet . Dieser Schritt schliefit nicht 
aus, daft ein oder mehrere konf igurierbaren Elemente 
wahrend der Abarbeitung des FILMOs, in den Zustand 
"umkonfigurierbar" iibergehen. Diese Anderung ist fur die 
CT wahrend der Verarbeitung lediglich nicht sofort 
sichtbar, sondern erst zu Beginn des nachsten 
Durchlaufs. 

Konfigurations-Reihenfolgen 

Zur Konfiguration bestimmter Algorithmen ist es 
unbedingt notwendig, die Reihenfolge in der die KW in 
die CEL geschrieben werden exakt einzuhalten. 
Beispielsweise ist es sinnvoll vor Anschluft einer CEL an 
ein Bussystem, zuerst das Bussystem zu konf igurieren, 
damit die CEL nicht. an einen von einer anderen Routine 
benutzten Bus angeschlossen wird. Mit anderen Worten, 
eine CEL wird nur konf iguriert, wenn vorher die 
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entsprechenden Busverbindungen konfiguriert werden 
konnten. 

In dem erf indungsgemaAen Verfahren wird die Einhaltung 
eines f esten Ablauf es wie folgt erreicht : 
Konfigurationsworte (KWs) , deren Ausf uhrung entscheidend 
fur die Konf iguration der nachf olgenden KWs sind, werden 
besonders gekennzeichnet (und im f olgenden KWR genannt) . 
Schlagt die Konf iguration eines solchen KWR fehl, werden 
alle nachfolgenden KWs innerhalb der betreffenden 
Konfigurationsroutine (KR) auf den FILMO geschrieben und 
in diesem Durchlauf nicht ausgefiihrt. Auch beim 
Durchlaufen des FILMOs werden samtliche KWs, die sich in 
der Reihenfolge hinter einem KWR befinden, dessen 
Konfiguration fehlschlug, in dem aktuellen Durchlauf 
nicht ausgefuhrt. 

Cache-Verfahren 

Die CT-Struktur ist hierarchisch aufgebaut, d.h. es 
existieren in einem Baustein mehrere CT-Ebenen . Die 
Anordnung entspricht vorzugsweise einer Baumstruktur 
(CT-Tree) . Dabei ist der Wurzel-CT (Root-CT) ein 
externer Konf igurationsspeicher (ECR) , der samtliche KRs 
enthalt zugeordnet, wahrend den Blattern die 
konfigurierbaren Elemente (CELs) zugeordnet sind, die 
einzelne KRs aufrufen. Den CTs der mittleren Ebenen sind 
jeweils die konfigurierbaren Elemente zugeordnet, die 
sich auf derselben Hierarchiestuf e bef inden . 
Jeder CT ist ein lokaler interner Speicher zugeordnet. 
Dieser Speicher wird partiell geldscht, wenn neu zu 
speichernde KRs keinen Platz mehr haben, oder dies 
explizit durch einen speziellen CT-Befehl (REMOVE) 
angefordert wird. Dabei erfolgt das Loschen KR-weise, 
anhand einer Loschstrategie, so daft bestenfalls nur die 
KR geloscht werden, die nicht mehr angefordert werden 
oder explizit beim REMOVE-Bef ehl angegeben sind. 
Ebenfalls werden die KR einzeln geloscht, nur genau so 
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viele, daft genau so viel Speicher frei ist, wie 
notwendig 1st urn die neu zu ladende KR in den Speicher 
zu schreiben. Dadurch wird erreicht, dafl moglichst viele 
KR zur Opt imie rung de s Cache-E f f e k t e s in dem. Speicher 
yerbleiben. 

Der Vorteil liegt darin, daft jede, einer beliebigen CTx 
untergordente CT, die sich also weiter oberhalb im CT- 
Baum befindet eine KR, die in der CTx gespeichert ist, 
nicht von dem externen Konf igurationsspeicher ECR 
anfordert, sondern direkt von CTx erhalt ♦ Dadurch ergibt 
sich eine Cachestruktur uber mehrere Ebenen. Der 
Datenubertragungsaufwand im CT-Baum und insbesondere die 
benotigte Speicherbandbreite des ECR wird erheblich 
gesenkt . 

Mit anderen Worten speichert jede CT die KRs der unter 
ihr liegenden CT zwischen. D.h. die tief erliegenden CTs 
erhalten die benotigten KRs direkt von den 
dariiber liegenden, ein Speicherzugrif f auf das externe 
ECR ist nicht notwendig. Nur wenn eine benotigte KR 
nicht in einer der hoherliegenden CTs bereits vorhanden 
ist, mufi die KR uber einen Zugriff auf das ECR geladen 
werden. Dadurch ergibt sich einer besonders effiziente 
hierarchische Cache-Struktur fur KRs. 
Auf Basis dieser Struktur ergeben sich auch mogliche 
Loschstrategien, die allerdings je nach Anwendung 
empirisch festgelegt werden sollten. Einige 
Moglichkeiten sind: 

- Loschen des altesten Eintrage 

- Loschen der kleinsten Eintrage 

- Loschen der groflten Eintrage 

- Loschen der am seltensten abgerufenen Eintrage 
Grundlage von CT-Hierarchien 

Urn einen Cache-Effekt zu erzielen, werden CTs zu einer 
Hierarchie in Baumstruktur zusammengeschaltet . Zwischen 
den einzelnen Knoten (CTs) befindet sich ein Bussystem 
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(Inter-CT-Bus) , dafi jeweils einen oberen Knoten (CTs) 
mit mehreren unteren Knoten (CTs) verbindet. Dabei 
fordern untere Knoten (CTs) Daten von den oberen Knoten 
. (CTs); an, die oberen Knot en senderi die Daten darauf hin 
an die unteren Knoten . Die unteren Knoten tauschen . 
untereinander Statusinformationen aus, dazu werden die 
Netzwerke zwischen den hoheren Knoten verwendet, die 
entsprechend die Adressen auflosen miissen. 

CT-Hierarchie und Adressierung 

CT-Hierarchien sind so angeordnet, dafi zur Adressierung 
der einzelnen CTs ein Binarbaum verwendet werden kann. 
Das bedeutet, dafi das niederwertigste Adressbit die 
einzelnen Blatter des Baumes kennzeichnet und jedes 
weitere Adressbit jeweils eine Hierarchieebene hoher 
selektiert. Jede CT besitzt damit eine eindeutige 
Adresse . 

Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind: 
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Soli einer Gruppe von CTs eine ttbergeordnete CT 
zugeordnet werden, werden mehr ere Adressbits der Gruppe 
entsprechend zusammengef aBt . 
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Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind, dabei 
befindet sich auf Ebene 0 eine Gruppe mit 8 CTs 
(Adfesbit 2. .0) 
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Der Aufbau des Binarbaumes kann eindimensional oder 
mehrdimensional erfolgen, indem pro Dimension ein 
Binarbaum aufgebaut wird. 

Eine bestintmte CT (TARGET) wird adressiert, indem die 
initierende CT (INITIATOR) entweder die exakte 
Zieladresse angibt, oder TARGET relativ adressiert. 

Die Auswertung einer relat iven Adresse wird im folgenden 
nahers beschrieben: 



Beispiel eines relativen Adressfeldes fur eine 
zweidimensionale Adressierung: 
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BitlS ist gesetzt, wenn die CT der nachsthoheren 
Hierarchiestufe selektiert werden soil. 

Bitl4 kennzeictinet Broadcasts, selektiert also alle CTs. 
Die X/Y-Adresseh geben die Adresse von TARGET ausgehend " 
von der Adresse von INITIATOR an. .... 

Die Adressen sind vorzeichenbehaf tete "signed" Integer- 
Zahlen. Durch Addition der Y/X-Addressen des 
Adressfeldes. zu der aktuellen Adressposition, wird 
TARGET bestimmt . Jede Ebene besitzt eine bestimmte 
Adressbreite (Addresswidth) . Die Addierer entsprechen 
dieser Breite. \ 
Ein Uber- oder Unterlauf bei der Addition bedeutet,, dafi 
die : adressierte CT nicht unterhalb des aktuellen Knotens 
liegt und die Adressanf orderung wird an die 
daruberliegende CT (den nachsthoheren Knoten) 
weitergegeben . 

Tritt kein Uber- oder Unterlauf auf, befindet sich 
TARGET unterhalb des aktuellen Knotens. Das auf der 
aktuellen Ebene berechnete Adressbit (vgl. Tabellen) 
selektiert den direkt unter dent aktuellen Knoten 
liegende CT. Von dieser aus wird jeweils anhand des 
entsprechend berechneten Adressbits die nachst tiefere 
CT (Knoten) selektiert. 

Priorisierung von Zugrxffen in CT-Hierarchien 

Die Zugriffe auf den Inter-CT-Bus werden von einem 
Arbiter verwaltet. Dabei sind alle unteren Knoten gleich 
priorisiert. Der obere Knoten besitzt eine hohere 
Prioritat. Dadurch sind Zugriffe, die von einem hoheren 
Knoten nach unten iibertragen werden, oder bereits einen 
weiten Weg vom INITIATOR aus zuruckgelegt haben anderen 
Zugriffen liberlegen. 

Der Grundaufbau einer CT 

Die nachfolgende Ubersicht iiber die CT gibt einen 



16 



WO 99/44147 



PCT/DE99/00504 



Uberblick uber die einzelnen Baugruppen. Die detailierte 
• Beschreibung der Baugruppen wird im folgenden gegeben. 

Kern einer CT ist die : Steuer-Statemachine. (CTS) die • 
samtliche Abarbeitungen von Konf iguratiorisroutinen (KRs) 
steuert . Der CTS zugeordnet ist/ der Garbage-Kollektor 
(GC) , der das Entfernen von KR aus dem Speicher (CTR) 
der CT steuert; das FILMO, das die Verwaltung der noch 
abzuarbeitenden KWs ubernimmt und die LOAD-Statemachine, 
die das Laden von KRs steuert. 

Der Speicher (CTR) ist als gewohnlicher Schreib-Lese- 
Speicher ausgestaltet , wobei alle technisch moglichen 
Implement ierungen ziim Einsatz kommen konnen/ und wird 
zur lokalen Speicherung von KRs fur die jeweilige CT und 
deren untergeordnete CTs verwendet. Als Sonderfall kann 
der Speicher (CTR) auch als ROM, EPROM, EEPROM, Flash- 
ROM o.a. ausgestaltet sein, urn den Baustein mit einer 
festen, ASIC oder PLD-ahnlichen (siehe Stand der 
Technik) Funktion zu versehen. 

Zur Generierung der CTR-Adressen werden vier als ladbare 
Zahler ausgestaltete Pointer verwendet: 

1. Free-Pointer (FP) . Zeigt auf den ersten freien 
Speicherplatz hinter der letzte KR ira CTR. 

2. Garbage-Pointer (GP) . Zeigt auf einen durch den 
Garbage-Kollektor (GC) zu entfernenden Eintrag aus dem 
CTR, 

3. Move-Pointer (MP). Zeigt auf eine Speicherstelle im 
CTR, von der ein gultiges, nicht zu entfernendes 
Konfigurationswort (KW) , also einen Eintrag eines KR, an 
den durch GP definierten Eintrag kopiert/bewegt wird. 

4. Program-Pointer (PP) . zeigt auf das momentan von der 
CTS ausgefiihrten KW. 
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KW werden iiber ein Ausgabe-Interface (OUT) an die 
zugehorenden CELs weitergegeben . Die CELs quittieren 
(ACCEPT) , sofern sie sich in einem umkonf igurierbaren 
Zustand bef iriden den Empfang der KW, Wird ein KW nicht 
quittiert (REJECT) , . wird es in einem FIFO-ahnlichen 
Speicher (FILMO) , zeitweise zwischengespeichert, urn zu 
einem spateren Zeitpunkt, ohne den Program-Pointer zu 
benutzen, erneut an die adressierte CEL geschrieben zu 
werden. . . 

Eine Aufforderung zur Abarbeitung eines KR erhalt die 
CTS. durch Triggersignale . Die Triggersignale durchlaufen 
eine Maske, das ist ein Filter, der unerwunschte Trigger, 
ausfiltert (ausmaskiert) . Eine Maske kann nach dem Stand 
der Technik durch UND-Gatter (AND) aufgebaut werden, die 
einen Trigger mit einem Freigabe-Signal UND~verkniipf t . 
Die Trigger werden iiber einen priorisierten Round-Robin- 
Arbiter (SCRR-ARB) in Binarsignale umgewandelt . Ein 
priorisierter Round-Robin-Arbiter verkmipft den Vorteil 
der Gleichberechtigung eines Round-Robin-Arbiters mit 
der Erkennung der nachsten Freigabe in einem Takt, also 
dem Vorteil eines Prioritats-Arbiter . 

Die maskierten Trigger werden als Adresse auf eine erste 
Lookup-Tabelle (LUT1) geschaltet, das ist ein Speicher, 
der dem als Adresse eingehenden Trigger das ID der 
betreffenden KR zuordnet und auf den Datenleitungen 
ausgibt . 

In einer zweiten Lookup-Tabelle (LUT2) wird die ID der 
KR der Adresse des Speicherplatzes der KR im CTR 
zugeordnet. Die zweite Lookup-Tabelle wird nicht nur zur 
Zuordnung von Trigger-Signalen verwendet, vielmehr 
benutzen Befehle, die eine ID als Parameter verwenden, 
die LUT2 ebenfalls zur Adress zuordnung. 
Die Zuordnung der Trigger-Signale zu den betreffenden 
IDs wird iiber den nachfolgend beschriebenen Befehl 
"REFERENCE" in die LUT1 eingetragen. Die Verwaltung der 
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LUT2, also die Zuordnung der IDs zu den Adressen im CTR, 
geschieht automatisch durch die CTS und den GC. 

Zum besseren Verstandnis der CT 1st im f olgenden ein 
moglicher Grundbef ehlssatz dargestellt : ... 

1. BEGIN <ID> 

Durch BEGIN <ID> wird der Anfang einer 
Konfigurationsroutine gekennzeichnet. <ID> gibt die 
eindeutige Identif ikationsnummer der 
Konfigurationsroutine an, 

2. STOP 

Durch STOP wird das Ende einer Konfigurationsroutine: 
gekennzeichnet. An dieser Stelle beendet die ... 
Konfigurationstabelle (CT) die Abarbeitung der 
Konfigurationsroutine. Der Garbage-Kollektor (GC) 
beendet das Entfernen von Eintragen dieser 
Konfigurationsroutine . 

3. EXECUTE <ID> 

Springt zum Beginn (BEGIN <ID>) einer 
Konfigurationsroutine. 1st diese Routine nicht im 
Speicher der CT vorhanden, so wird sie von der 
dariiberliegenden CT angefordert, bzw. aus dem Speicher 
geladen. 

4. LOAD <ID> 

Fordert die KR <ID> von der dariiberliegenden CT an. 

5. REMOVE <ID> 

Ruft den GC auf, urn die Konfigurationsroutine <ID> von 
BEGIN <ID> bis STOP aus dem Speicher der CT zu entfernen 
und die nachfolgenden Konf igurationsroutinen so weit 
vorzuschieben, daft kein Speicherloch durch die entfernte 
Konfigurationsroutine entsteht. 

6. PUSH <FORCED> <ADDRESS> <DATA> <EXIT> 

Schreibt die Konf igurationsdaten <DATA> an das Register 
<ADDRESS>. 1st <FORCED> gesetzt, werden die Daten auch 
geschrieben, wenn das RECONFIG-Flag des betreffenden 
Zielregisters nicht gesetzt ist. <EXIT> wird verwendet 
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und anzuzeigen, dafi es sich urn ein KWR handelt, das bei 
einem REJECT die weitere Ausfuhrung der nachf olgenden 
KWRs abbricht . ' 
.7, MASK <SR> • <TRIGGER> 

Setzt die Trigger-Maske mit . <TRIGGER>, bzw. setzt sie 
mit <TRIGGER> zurtick, abhangig von <SR> (Set/Reset). 
8. WAIT <UNMASKED> <TRIGGER> 

Halt die Abarbeitung der Konf igurationsroutine an und 
wartet auf den Trigger <TRIGGER> . 1st <UNMASKED> 
gesetzt, wird auf das erwartete Trigger unabhangig des. 
Zustandes der Trigger-Maske reagiert. 
?. TRIGGER <TRIGGERXCT#> 

Sendet den Binarwert eines Triggers an die iibergeordnete 
durch CT# adressierte CT. 

10. GETBUS/GETCTS 

Baut eine Verbindung zu dem Inter-CT-Bus auf. 

11. LOOSEBUS/LOOSECTS 

Lost die Verbindung zum Inter-CT-Bus auf. 

12. REFERENCE <TRIGGERXID> 

Schreibt in die LUT1 bei Adresse <TRIGGER> den Wert 
<ID> f wodurch einem Triggersignal eine bestiinmte KR 
zugeordnet wird. 

Die Befehle EXECUTE, LOAD, REMOVE, PUSH, MASK, WAIT, 
TRIGGER, REFERENCE sind nur innerhalb der Klammer BEGIN 

STOP gul tig. Auflerhalb dieser Klammer werden die 
Bef ehle nicht ausgef lihrt . 



Der Aufbau einer Konf igurationsroutine (KR) sieht wie 
f olgt aus : 
BEGIN <ID>; 

gultige Befehle 

• • • 

STOP; 
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Indirekte Address ierung (Referenzierung) 

Das Cache-Prinzip der CT ermoglicht das 

Zwischenspeichern einer KR in einer CT, wobei die KR von 
mehreren unterschiedlichen tief erliegenden, CTs oder CELs 
genutzt werden. 

Werden von den tief erliegenden Einheiten Zugriffe auf 
das externe Interface des Bausteines (z.B. RAM, 
Peripherie) durchgefuhrt, ergibt sich die Notwendigkeit 
unterschiedliche Adressen oder. Teile des externen 
Interfaces zu speichern. Dadurch wiirde sich der Inhalt 
der einzelnen benotigten KRs grundlegend unterscheiden . 
. Ein Caching ist nicht mehr moglich. 
Abhilfe schafft eine indirekte Referenzierung. Dazu 
werden spezielle KR (im folgenden IKR genannt) 
verwendet, die die notwendigen externen Parameter 
beinhalten und setzen. Eventuell werden iiber Trigger 
andere unterschiedliche KRs in verschiedenen 
Hierarchieebenen aufgerufen. Ab Ende einer IKR wird das 
eigentliche KR aufrufen. Lediglich die IKR sind nicht 
cachebar, wahrend die aufgerufenen KR durchaus 
einheitlich und daher cachebar sind. Es ist sinnvoll, 
die Groiie der IKR auf das absolute Minimum zu 
reduzieren, namlich ausschliefllich die externen und 
unterschiedlichen Parameter und den Aufruf der 
einheitlichen KR. . 

Eine indirekte Konf igurationsroutine (IKR) ist wie folgt 

aufgebaut: 

BEGIN <ID>; 

... 

xxx; giiltige Befehle, wobei lediglich externe Peripherie 

angesteuert werden sollte, 
TRIGGER <ID>; Start-, Stop- oder Lade-Anf orderungen an 

Periphere Prozesse 

. ♦ » 

GOTO <ID>; Sprung zur einheitlichen KR 
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STOP; 



Sonderfalle: 

1 . WAIT_FORJBOOT 

Dieises Kommando ist nur an der ersten Adresse des CTR 
giiltig. Wahrend des Boot-Vorganges wird zuachst die 
komplette Boot-KR in das CTR geschrieben, jedoch nicht 
die Beginnsequenz des Boot-KR BEGIN <0>. An dessen 
Stelle (auf Adresse 1) steht WAIT-FOR-BOOT, das bei 
einem RESET automatisch gesetzt wird. Erst nachdem die 
gesamte Boot-KR in das CTR geschrieben ist, wird .>;/ 
WAIT_FOR_BOOT mit BEGIN <0> iiberschrieben und die CTS 
beginnt mit der Abarbeitung der Boot-KR. 
WAIT_FOR_BOOT darf nicht innerhalb eines Programmes 
auftreten . 

2. BOOT <CT-ID> 

BOOT <CT-ID> kennzeichnet in welche CT die nachfolgende 
Boot-KR geschrieben werden soli. Nach BOOT <CT-ID> folgt 
kein BEGIN, die Boot-KR wird nciht durch STOP, sondern 
durch ein nachf olgendes BOOT <CT-ID> abgeschlossen. Ein 
STOP beendet den Bootvorgang. 

BOOT <CT-ID> darf nicht innerhalb eines Programmes 
auftreten. 

Boot-Vorgang 

Nach einem RESET ladt die CT des obersten- Hierarchies 
Levels (ROOT-CT) die Boot-KR in die CTs der unteren 
Hierarchien. Dazu existiert ein Sprung an eine 
festgelegte Adresse (BOOT-ADR) im, der ROOT-CT 
zugeordneten, externen Konf igurationsspeicher (ECR) . Die 
ROOT-CT flihrt diesen Sprung durch und erreicht die Boot- 
Sequenz. Diese ist wie folgt aufgebaut: 
BOOT <CT-ID0>; COMMAND; COMMAND; . . . 
BOOT <CT-ID1>; COMMAND; COMMAND; ... 
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BOOT <CT-IDn>; COMMAND; COMMAND; ... 
STOP; 

Wahrend des Boot-Vorganges wird zunachst die komplette 
Bdot-KR in . das CTR ab Adresse 2 der durch <CT-ID> 
angegebenen CT geschrieben. Die Beginnsequenz des Boot- . 
KR (BEGIN <0>) wird nicht auf Adresse 1 geschrieben. An 
dessen Stelle steht WAIT-FOR-BOOT, das bei einem RESET 
automat isch gesetzt wird. Erst nachdem die gesamte Boot- 
KR in das CTR. geschrieben ist, und die ROOT-CT das 
nachste BOOT <CT-ID> erreicht hat ,. wird STOP an das Ende . 
des Boot-KR in das CTR geschrieben und WAIT_FOR_BOOT mit 
BEGIN <0> iiberschrieben. Die CTS beginnt mit der 
Abarbeitung der Boot-KR. 

Laden einer Konf igurationsroutine 

Es existierem drei Gundmechanismen urn eine 

Konf igurationsroutine, aufcer der Boot-KR anzufordern: 

1. Ausfuhren eines LOAD <ID> durch die CTS 

2. Ausfuhren eines EXECUTE <ID> durch die CTS, wobei die 
KR mit der betreffenden ID nicht im CTR vorhanden ist. 

3. Auftreten eines Triggers, der uber die LUT1 auf einen 
<ID> libersetzt wird f dessen zugehorige KR nicht im CTR 
vorhanden ist. 

Der Ablauf in alien drei Fallen ist derselbe: 

Die ID der angef orderten KR wird der LUT2 als Adresse 

angegeben. Die LUT2 ttberpruft, ob eine gultige Adresse . 

im CTR existiert. Existiert diese nicht, d.h. <ID> zeigt 

in der LUT2 auf den Wert 0, wird load <ID> an die CTS 

gesendet. 

Die CTS fordert daraufhin die <ID> betreffende KR bei 
der hierarchisch iibergeordneten CT an. Diese Anforderung 
erreicht die ubergeordnete CT in Form eines Triggers und 
wird entsprechend von ihr ausgewertet. 

Die ubergeordnete CT sendet die angeforderte KR an die 
anfordernde CT. Die Daten werden ab der Adresse, auf die 
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der FREE-POINTER (FP) zeigt in das CTR geschrieben, 
wobei der FP nach jedem Schreibzugrif f urn eins erhoht 
wird. 

Erreicht der FP. die bbere Grenze des CTR, wird der 
Garbage-Kollektor (GO) aufgerufen, um die unterste KR. 
innerhalb des CTR zu entfernen und das CTR zu 
komprimieren . Der FP wird dabei neu gesetzt. Dieser 
Vorgang findet so lange statt, bis die zu ladende KR 
komplett in das CTR paflt. 

Sprungtabelle im Konf igurationsspeicher 

Der der ROOT-CT zugeordnete Konf igurationsspeicher 
beinhaltet samtliche KR/ die fur eine Applikation 
geladen werden mussen. Im externen 

Konfigurationsspeichers (ECR) befindet sich an einer 
festgelegten Adresse (ADR-BOOT) Sprung zu der Boot- 
Konf igurations-Routine. In einem weiteren festgelegten 
Speicherbereich (LUT-ECR) beliebiger, jedoch innerhalb 
einer Applikation fest vorgegebener Lange die Sprunge zu 
den einzelnen KRs . Dabei wird die <ID> der jeweiligen KR 
als Adresse im ECR verwendet, an der die Startadresse 
der jeweiligen KR steht; wodurch KRs indirekt adressiert 
werden : 

ID -> LUT-ECR -> KR 

Anderung der KR im Konf igurationsspeicher 

Die KRmit der ID <A> soil geandert werden. Zunachst 
schreibt der HOST die neue KR fur die ID <A> an eine 
freie Speicherstelle im ECR. Die ID <A> wird zusammen 
mit der neuen Adresse der KR im Konf igurationsspeicher 
von der iibergeordneten Einheit (HOST) in ein dafur 
vorgesehenes Register der ROOT-CT geschrieben. Die ROOT- 
CT sendet an alle darunterliegenden CTs das Kommando 
REMOVE <A>. Daraufhin entfernen alle CTs beim Erreichen 
eines STOP oder wahrend IDLE-Zyklen, also sobald keine 
KR ausgefuhrt wird, die auf diese ID bezogene KR aus dem 
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CTR und setzen die LUT2 an Adresse <A> auf "NoAdr", das 
bedeutet, es existiert keine gtiltiger Adresseintrag fiir ; 
ID <A> in LUT2. Wird die ID <A> erneut angefordert, 
zwingt der fehlende Eintrag ("NoAdr") an Stelle <A> in 
die LUT2 jede CT die KR <A> vpm ECR neu anzuf ordernv .. . 

Das FILMO 

Ein KR besteht hauptsachlich aus dem Befehl PUSH, der 
neue Konf igurationsworte an eine bestimmte Adresse 
schreibt . 1st das Schreiben eines Konf igufationswortes 
des Types KW nicht moglich, da das adressierte 
konfigurierbare Element (CEL) nicht bereit 1st eine neue 
Konfiguration zu empfangen (REJECT) , wird das 
Konfigurationswort statt an das adressierte 
konfigurierbare Element (CEL) in einen Speicher, im 
folgenden FILMO genannt, geschrieben. Die nachf olgenden 
Befehle werden normal abgearbeitet, bis erneut ein 
Konfigurationswort nicht geschrieben werden kann, das 
dann in das FILMO geschrieben wird. 

1st das Schreiben eines Konf igurationswortes des Types 
KWR nicht moglich, da das adressierte konfigurierbare 
Element (CEL) nicht bereit ist eine neue Konfiguration 
zu empfangen (REJECT) , wird das Konfigurationswort statt 
an das adressierte konfigurierbare Element (CEL) in 
einen Speicher, im folgenden FILMO genannt, geschrieben. 
Alie nachf olgenden Befehle bis zum Ende der KR werden : 
nicht an die CEL, sondern direkt in das FILMO 
geschrieben. 

Das FILMO wird in IDLE-Zyklen und vor jedem Ausfiihren 
eines neuen KR komplett durchlaufen. Dabei wird, 
beginnend beim altesten Datenwort, entsprechend eines 
FIFOs nach dem Stand der Technik, jedes ausgelesene Wort 
des FILMOs an sein adressiertes Element zu senden; dabei 
mufl das adressierte Element bereit sein das 
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Konfigurationswort zu empfangen. Sofern die Datenworter 
von Beginn an geschrieben werden konnen (d.h. die 
adressierten konf igurierbaren Elemente (CELs) sind 
bereit). wird der Eintrag aus dem FILMO nach Art eines 
FIFOs entfernt.. Kann ein Konfigurationswort nicht . 
geschrieben werden, wird es ubersprungen und nicht aus 
dem FILMO entfernt. Im Gegensatz zu einem FIFO werden 
die Daten nach dem ubersprungenen Konfigurationswort 
weiter ausgelesen. Konf igurationsworte, die nach einem 
ubersprungenen Konfigurationswort geschrieben werden 
konnen werden entweder je nach Implementierung des 
FILMOs ' 

1. als geschrieben markiert und nicht aus dem FILMO 
geloscht, wobei als geschrieben markierte 
Konfigurationsworter bei den folgenden Durchlaufen nicht 
mehr gelesen werden, bzw. sofort geloscht werden, sofern 
kein ubersprungenes Konfigurationswort mehr vor ihnen 
liegt; 

oder 

2. aus dem FILMO geloscht, wobei die 
Konfigurationsworter vor und nach dem geloschten 
Konfigurationswort erhalten bleiben, dabei mtissen zum 
Loschen die nachf olgenden Worte nach vorne (oben) oder 
die davorliegenden Worte nach hint en (unten) geschoben 
werden, wobei die Reihenfolge der Konf igurationsworte 
unbedingt beibehalten wird. 

Wird eine neue KR ausgefuhrt, werden die 
Konf igurationsworte (KW) , die von der CTS nicht an die 
adressierten Elemente (CELs) geschrieben werden konnten, 
erneut an das FILMO angehangt, d.h. die KW werden an das 
Ende (aus Leserichtung) des FILMOs geschrieben. 1st das 
FILMO voll, d.h. es existieren keine freien Eintrage fur 
Konfigurationsworte, wird die Ausfuhrung des KR 
gestoppt. Das FILMO wird so lange durchlaufen, bis 
genugend Konfigurationsworte geschrieben werden konnten 
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und entsprechend viele freie Eintrage entstanden sind, 
woraufhin das KR weiter abgearbeitet wird. 
Das FILMO stellt einen FIFb-atinlichen Speicher dar, der 
immer vom altesten Eintrag an linear durchlauf eh wird, 
im Gegensatz zu einem FIFO werden jedoch Eintrage 
ubersprungen (First In Linear Multiple Out) . 

Die Funktion der Konfigurationstabellen- 
Statemachine (CTS) 

Die Konfigurationstabellen-Statemachine (GTS) iibernimmt 
die Steuerung der CT. Dabei fiihrt sie die Befehle der KR 
aus und reagiert auf eingehende Trigger. Sie ubernimmt 
die Verwaltung des FILMOs, i.b. liest sie in IDLE-Zyklen 
und vor dem Ausfiihren einer KR das FILMO aus. 
Sie reagiert auf die von der LUT-Struktur generierten 
Signalen illegal <TRG> (Illegal Trigger, siehe Fig. l f 
0102) und load <ID>. load <ID> wird generiert, wenn ein 
Cache-Miss in LUT2 vorliegt (0105), oder die durch ID 
referenzierte KR/IKR als geloscht markiert wurde (0107) . 
Sie reagiert auf die Steuersignale der ubergeordneten 
CT. 

Ein Implementationsbeispiel fur die Verarbeitung der 
Befehle ist in den Figuren 2 bis 7 dargestellt. 

Steuersignale an ubergeordnete CTs 

- illegal <TRG> (0102) 

Zeigt der ubergeordneten CT an, dali ein unbekannter 
Trigger <TRG> aufgetreten ist. 

- load <ID> (0105/0107) 

Fordert die ubergeordneten CT zum Laden der <ID> 

auf. 

- trigger <TRG> <CT#> (0108) 

Sendet einen Trigger <TRG> an die ubergeordnete 

oder 

an die adressierte CT <CT#>. 
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Steuersignale von ubergeordneten CTs 
- remove <ID> (siehe Fig. 15, 1513) 

Fordert die CT zum loschen der <ID> auf. 
'-' write_to_FP <data> (siehe Fig. 2, 0205) 

Sendet Daten an die CT. Die Daten werden an das. 
Ende des belegten Speichers angehangt. 

Die Funktion des Garbage-Kollektors (GC) 

Der CTR unterliegt zwei Problemen: 

1. Verweist ein LOAD- oder EXECUTE-Bef ehls, bzw ; . ein 
Trigger, auf eine ID, deren KR nicht im CTR vorhanden 
ist> mufc die KR nachgeladen werden. U.U. ist jedoch . 

..nicht'. genflgend Platz im CTR. vorhanden urn die 
angeforderte KR zu laden. 

2. Beim Auftreten eines REMOVE <ID> ist die 
entsprechende KR aus dem CTR zu entfernen. Dabei 
entsteht, sofern sich die KR nicht am Ende des CTR 
befindet eine Lucke. Beim Laden einer neuen KR wird die 
Lucke u.U. nicht wieder ganz aufgefullt oder die Lucke 
ist zu klein fur die neue KR. Dies fuhrt zu einer 
Fragment ierung des CTR. Die Aufgabe des Garbage- 
Kollektor ist es, KR aus dem CTR zu entfernen, urn Platz 
fur neue Eintrage zu schaffen UND nach Entfernen der 
Eintrage den CTR so umzuorganisieren, daft alle 
verbleibenden KR als geschlossener Block hintereinander 
im Speicher liegen und die f reigewordenen Speicherblocke 
als ein geschlossener Block an einem Ende des CTR 
liegen. 

Dadurch konnen auf optimale Weise und ohne Verluste an 
Speicherplatz neue KR nachgeladen werden. 

Auswerten von Triggerimpulsen 

Jede CT besitzt einen Anschlufl an mehrere zu ihrer 
jeweiligen Hierarchieebene gehorenden Trigger signale, 
die zu einem Bus zusammengef aflt sind. Eingehende Trigger 
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werden uber eine Maske ausgewertet, d.h. nur die 
freigeschalteten Triggersignale werden weitergeleitet. 
Die freigeschalteten Triggersignale werden taktsynchron 
in einem Sample-Register zwischengespeichert 
(gesampled) . Ein Arbiter wahlt eines der gespeicherten 
Triggersignale aus und wandelt das Signal in einen 
binaren Vektor. Das gewahlte Triggersignal wird aus den 
Sample-Register geloscht. Der Binarvektor wird an eine 
erste Lookup-Tabelle (LUT1) weitergeleitet, die den 
Binarvektor in die Identif ikationsnummer (ID) der 
aufzurufenden Konf igurationsroutine (KR) ubersetzt. 
Die ID wird in einer zweiten Loqkup-Tabelle (LUT2) in 
die Adresse der KR im CT-Speicher (CTR) ubersetzt. Die 
CT-Statemachine (CTS) setzt ihren Programm-Pointer (PP) 
auf diese Adresse und beginnt mit der Ausfuhrung der KR. 
Voraussetzung ist f dafl jeder iiber die Maske 
freigeschaltete Trigger einen entsprechenden Eintrag in 
LUT1 besitzt. Fehlt dieser, wird ein Fehlerzustand an 
die CTS weitergeleitet (illegal trigger) , dabei wird 
jede ID = "NoAdr" als nicht vorhandener Eintrag 
gewertet. "NoAdr" ist ein implementationsabhangig 
gewahltes Token. 

Fehlt der Eintrag in LUT2, d.h. die auf die ID bezogene 
KR befindet sich nicht im CTR, wird eine Ladeanf orderung 
an die CTS gesendet (load <ID>) . 

Senden von Triggeriiapulsen an die ubergeordnete 
CT 

Neben der bereits beschriebenen Schnittstelle zu einer 
iibergeordneten CT zum Laden von KR existiert eine 
weitere Schnittstelle zum Austauschen von frei 
definierbaren Befehlen, insbesondere jedoch 
Triggervektoren. Dabei sendet eine CT 

- entweder an alle anderen CTs einen Befehl (BROADCAST) 
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- Oder an eine beliebige adressierte CT einen Befehl 
(ADDRESSED) 

Der Befehl n Triggervektor n stellt einen Binarwert dar, 
der auf einen Eintrag in der LUT2 der. empfangenden CT 
referenziert . 

Das Senden von Triggervektoren ist notwendig um 
beispielsweise innerhalb einer IKR eine KR in einer 
weiteren CT zu starten um beispielsweise die Peripherie 
Oder den Speicher anzusteuern . 

Zur Weiterleitung von Triggervektoren an eine 
ubergeordnete CT existieren 2 Mechanismen: 

1. Der LUTlwird ein Bit hinzugefugt, das angibt, ob der 
Inhalt des Speichers als KR ID oder als Binarwert fur 
einen Triggerimpuls betrachtet wird. Liegt ein 
Triggerimpuls vor, wird der Dateninhalt von LUT1 direkt 
als Trigger an die ubergeordnete CT gesendet. 

2. Mit dera Befehl TRIGGER kann der Binarwert eines 
Triggers angegeben werden, der direkt an die 
ubergeordnete CT gesendet wird. (Alternativ konnten 
statt einem Triggerwert auch direkt IDs ubertragen 
werden) . 

Zum Starten einer KR in einer fremden CT iiber 
Triggervektoren muli zum Erreichen der Deadlockf reiheit 
ein Synchronisationsverf ahren geschaf f en werden . Das 
Verfahren mufi beachten, dafi lediglich eine KR innerhalb 
eines bestimmten Gruppe von CTs weitere KR auf anderen 
CTs innerhalb dieser Gruppe startet. Das Starten mehrere 
KR gleichzeitig kann zu einem Deadlock zwischen den CTs 
fuhren, ahnlich des bereits beschriebenen Deadlocks auf 
der CEL-Ebene. 

Das Grundprinzip eines solchen Verfahrens lauft wie 
folgt ab: 
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Ein KR ist wie folgt aufgebaut: 

GETCTS/GETBUS 
' TRIGGER <ID>, <CT#> 
: TRIGGER <ID>,. <CT#> 

LOOSECTS/LOOSEBUS 
• • • • 

Der Befehl "GETCTS" innerhalb einer KR einer CT 
(INITIATOR) zeigt an, daii im folgenden Signale an andere 
CTs (TARGET) gesendet werden. Mit Trigger <ID>, <CT#> 
wird die ID einer zu startenden. KR an die CT mit der 
eindeutigen ID CT# gesendet. Das Sendein des Triggers 
geschieht dabei zunachst an die direkt ubergeordnete CT, 
die entsprechend der CT# den Trigger an eine wiederum 
untergeordnete CT innerhalb ihres . CT-Raumes sendet Oder 
an die ihrerseits ubergeordnete CT (siehe CT- 
Hierarchien) . Erreicht der Befehl die TARGET quittiert 
diese den Empfang. 

Beim Durchlauf des Befehls durch eine CT wird eine 
Prioritatskennung des Befehls jeweils urn eines erhoht. 
Trifft die Weiterleitungsanf orderung eines Befehls auf 
eine weitere Anforderung innerhalb einer CT, wird der 
Befehl mit der niedersten Prioritat zuriickgewiesen. 
Dadurch wird 

a) sichergestellt, daft innerhalb eines uberschneidehden 
Systemes nur ein Befehl zu einer Zeit ausgebreitet wird 
und dadurch auch nur eine KR gestartet wird, was zu der 
geforderten Deadlockf reiheit fuhrt, 

b) sichergestellt, da£ der bislang am wenigsten weit 
ausgebreitete Befehl zuriickgewiesen wird, was zu einer 
Steigerung der Performance fuhren kann 

Nach Zuruckweisen eines Befehls, werden alle 
vorhergehenden Befehle innerhalb der GETCTS/LOOSECTS 
ebenfalls zuriickgewiesen, d.h. INITIATOR sendet an alle 
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TARGET das Signal DISMISS und die Ausfuhrung der KR 
startet nach einer Wartezeit bei GETCTS erneut.. 
Die Quittierungen aller Trigger innerhalb eines 
Befehlsabschnittes GETCTS . . LOOSECTS werden an die 
. INITIATOR-CT gesendet. Bei jeder eintref f enden 
Quittierung wird die Verarbeitung des nachsten Befehls 
fortgesetzt. 

Bei Erreichen des Befehls LOOSECTS sendet INITIATOR an 
alle TARGET das Signal GO. Dadurch starten die TARGET- 
CTs die Ausfuhrung der KR mit der von Trigger 
ubertragenen ID. 

TARGETS wechseln nach ^Auftreten eines Triggers in einen 
Zustand, iri welchem sie auf das Auftreten eines GO oder 
DISMISS Signales warten. 

Aufgrund der besseren Implementierbarkeit wird weiterhin 
ein leicht modif iziertes Verfahren vorgestellt: 
Zwischen den CTs einer Gruppe einer Hierarchieebene 
befindet sich ein Bussystem (Inter-CT-Bus) . Dieses 
Bussystem verbindet alle CTs der Gruppe und eine direkt 
der Gruppe ubergeordnete CT. 

Durch den Befehl GETBUS, der funktionell GETCTS ahnlich 
ist, wird das Bussystem von einer CT arbitriert. Die 
Befehle werden uber das Bussystem an die CTs derselben 
Gruppe weitergeleitet . Befindet sich die adressierte CT# 
nicht innerhalb der Gruppe , wird durch die ubergeordnete 
CT automatisch deren ubergeordneter Bus arbitriert und 
der Befehl weitergeleitet. Die arbitrierten Busse 
bleiben INITIATOR zugeordnet und somit fur alle anderen 
CTs gesperrt, bis entweder eine Zuriickweisung erfolgt, 
Oder der Befehl LOOSEBUS den Bus auf lost . LOOSEBUS 1st 
mit LOOSECTS vergleichbar . Vor Ausfuhren des Befehls 
LOOSEBUS wird das GO-Signales an alle beteiligten Cts 
gesendet. Dies erfolgt entweder durch den Befehl 
LOOSEBUS oder einen speziellen vorgeschalteten Befehl. 
Befehle, i.b. Trigger werden ebenfalls gemaA des bereits 
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beschriebenen Grundverf ahrens verarbeitet. Eine 
Zuruckweisung erfolgt, wenn ein Bus system nicht 
arbitriert werden kann. Beim Arbitrieren sind die CTs 
einer Ebene jeweils gleich priorisiert / die 
. ubergeordnete. CT besitzt eine.hohere Prioritat... 
Beim Senden eines Befehls uber den Inter-CT-Bus bleibt 
der Befehl so lange aktiv, bis die adressierte CT den 
Befehl akzeptiert (ACCEPT) oder zuruckweist (REJECT) . 

Der priorisierte Round-Robin-Arbiter 

Der priorisierte Round-Robin-Arbiter (Single-Cycle- 
Round-Robin-Arbiter SCRR-ARB) ist taktsynchron 
aufgebaut, d.h . bei jeder - je nach Implement ierung . 
positiven oder negativen - Taktflanke (TF1) liefert er 
ein Ergebnis. Die eingehenden Signale (ARB-IN) 
durchlauf en eine Maske (ARB-MASK) , die von dem Arbiter 
gemali dem nachfolgend beschriebenen Verfahren selbst 
verwaltet wird. Die Ausgangssignale der Maske werden an 
einen Prioritatsarbiter (ARB-PRIO) nach dem Stand der 
Technik geleitet. Der Arbiter liefert taktsynchron bei 
jeder Taktflanke (TF1) ein Ergebnis (ARB-OUT), d.h. den 
Binarwert des hochstpriorisierten Signals nach der Maske 
(ARB-MASK) . Dem Ergebnis zugeordnet ist ein Signal 
(VALID), das angibt, ob der Binarwert gultig. oder 
ungultig ist. Abhangig von der Implementierung der 
Prioritatsarbiters ist es moglich, dafi beim Anliegen des 
Signals 0 und beim Anliegen keines Signals derselbe 
Binarwert generiert wird: In diesem Fall zeigt VALID an, 
daft das Ergebnis ungultig ist, sofern kein Signal 
anliegt. Dieses Signal wird 

1. als Ergebnis der Arbiters ausgegeben 
und 

2. auf einen Dekoder geschaltet, der die Binarwerte - 
wie in der f olgenden , Tabelle beispielsweise fur einen 3- - 
bit Binarwert angeben - auskodiert • (Das 
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Kodierungsverf ahren ist gemafi dieses Prinzips auf jeden 
beliebigen Binarwert anpaBbar) : 



Binarwert 


Auskodierung 


Berne rkung 


(ARBttOUT) 


(ARB-DEC) 




111 


0111 1111 




110 


0011 1111 




101 


0001 1111 




100 


0000 1111 




Oil 


0000 0111 




010 


0000 0011 




001 


0000 0001 




000 


mi nil 


Reset-Zustand und 

wenn Binarwert (ARB-OUT) ungultig 



Dem Dekoder zugeordnet ist ein Register (ARB-REG) , das 
die auskodierten Werte (ARB-DEC) des Dekoders bei der zu 
TF1 inversen Taktflanke (TF2) ubernimmt . ARB-DEC wird 
auf die Maske (ARB-MASK) zuriickgekoppelt und schaltet 
die einzelnen Eingangssignale (ARB-IN) frei. 



Der funktionale Ablauf im Arbiter ist wie folgt: 

1. Nach einem RESET sind alle ARB-IN iiber ARB-MASK 
freigeschaltet, da ARB-DEC alle Signale auf 
"Freigabe" stellt. 

2. Das hSchst priorisierte gesetzte ARB-IN 

(beispielsweise besitzt in der obigen Tabelle das 
Signal 7 (binar 111) die hochste PrioritSt und 0 
(binar 000) die niederste Prioritat) wird als 
Binarwert ausgegeben. 

3. Uber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl. noch hoher priorisiert 
waren, aber nicht gesetzt sind. 

4. Die folgenden Schritte 5 und 6 wiederholen sich so 
lange, bis das Signal 0 (binar 000) erreicht ist, 
Oder kein Signal hinter ARB-MASK mehr anliegt. Dann 
schaltet ARB-DEC (siehe Auskodierungstabelle) wieder 
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alle Signale durch ARB-MASK iiber ARB-DEC frei und der 

Ablauf beginnt bei Schritt 2. 
5. Das nunmehr hochst priorisierte gesetzte ARB- IN wird 

als Binarwert ausgegeben . 
.6. iiber ARB-DEC wird das Signal gesperrt, sowie alle .. 

weiteren Eingange die evtl. noch hoher priorisiert 

waren, aber nicht gesetzt sind. (Weiter mit Schritt 

4) 

Dadurch wird erreicht, dafi . alle. Eingangssignale 
gleichberechtigt behandelt werden und bei jedem 
Taktzyklus eines der Eingangssignale (ARB- IN) binar 
auskodiert und ausgegeben (ARB-OUT) wird. 
ARB-REG kann mit einem Enable-Eingang (EN) versehen 
werden, der eine Anderung des Registerinhaltes nur bei 
TF2 zulafit, wenn ein entsprechendes Signal anliegt. 
Dadurch wird nicht bei jedem Takt ein Binarvektor 
ausgegeben, sondern abhangig von einer Freischaltung 
durch EN und TF2 . Der Eingang wird zur Synchronisation 
notwendig, wenn die nachgeordnete Schaltung die 
Verarbeitung nicht in einem Taktzyklus durchfuhren kann, 
sondern mehrere Zyklen benotigt und erst dann den 
nachsten Binarvektor akzeptiert. 

Unter Umstanden ist es sinnvoll eine Reih'e von Signalen 
durch den Arbiter als hoher priorisiert anzusehen, 
wahrend die Mehrzahl der Signale gleichpriorisiert ist. 
Dies ist z.B, bei dem vorhergehend beschriebenen 
Verfahren zur Weiterleitung von Signalen zwischen CTs 
notwendig. Urn ein Signal hoher zu priorisieren, wird der 
hochstpriorisierte Anschlufi des ARB-PRIO nicht maskiert, 
d.h. an der Maske (ARB-MASK) vorbeigeleitet . Dadurch 
wird das Signal bevorzugt behandelt. 

Aufbau einer CT auf Basis eines Mikrokontrollers 

Abweichend von den bisherigen Beschreibungen kann eine 
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CT auch in einer Mikrokontrollerarchitektur 
implement iert werden. 

Es ist leicht einsehbar, dafi die Grundfunktionen, wie 
Trigger steuerung, Lookup-Tabelie LUTl und LUT2 , so wie 
die Inter-CT-Kommunikation und das -Schreib.en.der.-KW an 
die CEL ohne weiteres auch von einem Mikrokontroller 
ausgefiihrt werden konnen. Lediglich der Aufbau eines 
effizienten FILMOs stellt ein Problem dar, das sich vor 
allem in der erreichbaren Performance bemerkbar macht. 
Daher wird auf den Aufbau des. FILMOs gesondert . 
eingegangen. 

Aufbau des FILMOs 

Der FILMO ist nicht als separater Speicher ausgestaltet . 
Vielmehr ist der gewohnliche Programmspeicher urn die 
FILMO-Funktionalitat erweitert. Dazu wird ein 
zusatzliches Bit (FILMO-BIT) jedem KW zugeordnet, das 
anzeigt, ob das entsprechende KW in die CEL geschrieben 
wurde oder nicht. Ist FILMO-BIT gesetzt, wird das 
entsprechende KW nicht ausgefiihrt. Beim Schreiben eines 
Kws in den Speicher wird das FILMO-BIT zuriickgesetzt . 
Alle KRs innerhalb einer CT werden iiber eine Verkettete- 
Liste (FILMO-LIST) in der Reihenfolge miteinander 
verbunden, wie sie durch Trigger oder LOAD<ID> 
aufgerufen wurden. Eine KR bleibt so lange in der FILMO- 
LIST, bis sie kpmplett ausgefiihrt wurde, dann wird sie 
aus der Liste entfernt. Die FILMO-LIST wird entsprechend 
des FILMO-Verfahrens durchlaufen und stellt damit einen 
direkten Ersatz fur den FILMO-Speicher dar. 
(Der Vollstandigkeit halber sei angemerkt, dafi entgegen 
des ursprunglichen FILMO-Verfahrens keine KR zweimal in 
der Liste vorkommen kann. Wird eine KR aufgerufen, die 
noch in der FILMO-LIST steht, muA deren Ausfiihrung so 
lange verzogert werden f bis sie aus der FILMO-LIST 
entfernt wurde. ) 



36 



WO 99/44147 



PCT/DE99/00504 



Der Aufbau einer FILMO-Speicherstelle ist wie f olgt : 



FILMO-BIT 



KW 



Befehle ■■ 

Der Mikrokontroller unterstiitzt die folgenden Befehle, 
die direkten Einflufc auf das FILMO haben: 
PUSH Schreiben eines KW an eine CEL 

PUSHSF Schreiben eines KW an eine. CEL und. setzen des 
FILMO-BITs, wenn das KW angenommen 

(ACCEPT) wurde 

PUSHRET Schreiben eines KW an eine CEL und Riicksprung 
(RETURN) aus der Unterroutine, wenn das KW 
nicht von der CEL angenommen wurde (REJECT) . 
Dieser Befehl wird verwendet, wenn 
nachfolgende KW in der KR von der 
Konfiguration dieses KWs (ACCEPT) abhangig 
sind; durch den Riicksprung aus dem KR wird 
deren Konfiguration so lange verhindert, bis 
PUSHRET erfolgreich (ACCEPT) ist. 

PUSHNR Schreiben eines KW an eine CEL, nur dann, wenn 
zuvor innerhalb der KR kein REJECT auftrat. 
Dient ahnlich wie PUSHRET dazu, Abhangigkeiten 
in der Konf igurationsreihenfolge von KWs zu 
handhaben . 



Garbage Kollektor 

Entsprechend der bisherigen Beschreibung wird ein 
Garbage-Kollektor (GC) zum Entfernen von nicht mehr 
benotigten KRs benutzt. Der GC lauft an, wenn entweder 
der Platz zum Laden einer neuen KR im Speicher nicht 
mehr ausreicht und IDs entfernt werden mussen; oder eine 
KR explizit durch den Befehl REMOVE - mit der Angabe der 
ID der zu loschenden KR - geloscht wird. 
Urn den GC-Lauf moglichst einfach zu gestalten, werden 
samtliche KRs liber eine verkettete Liste miteinander 
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verbunden. GC lauft die Liste durch und entfernt die 
nicht mehr benotigten KR, indem sie von anderen KPL 
uberschrieben und die Listeneintrage entsprechend 
angepafit .werden. Dabei werden die alle verbleibenden KR 
im Speicher so verschoben> dafi. die .durch die zu 
loschenden KR entstehende Speicherlucke geschlossen wird 
und am Ende des Speichers ein grofierer zusammenhangender 
Freiraum entsteht. 

Aufbau einer KR 

Ein moglicher Grundaufbau einer KR ist in der folgenden 
Tabelle dargestellt: 

jmp START; 

length 

garbage - previous 
garbage - next 
FILMO - previous 

FILMO - NEXT 

CACHE - statistic 

KR - statistic 

START : 



ret; 



Zu Beginn der KR erfolgt ein Sprung uber den folgenden 
Header hinweg zum Start der Befehlssequenzen. Es folgt 
die doppelt verkettete Liste fur den Garbage-Kollektor, 
in der samtliche KR miteinander verbunden sind. 
"length" gibt die Lange der KR an. Diese Information 
kann fur Block-Move-Bef ehle nach dem Stand der Technik 
verwendet werden, die Anwendung finden, wenn die KR im 
Speicher bewegt werden mussen (Garbage, Load, etc.). 
In der anschliefienden doppelt verketteten Liste ist der 
FILMO aufgebaut, wobei nur die KRs miteinander verbunden . 
sind, die KWs enthalten, die noch nicht an die CEL 
geschrieben wurden. 
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Es folgt eine Statistik iiber das Cache-Verhalten, die 
beispielsweise die Anzahl der Aufrufe der KR (pro Aufruf 
wird der Wert urn 1 erhoht), das Alter (anhand der Anzahl 
der GC-Laufe iiber die KR mefibar: pro GC-Lauf wird der 
Wert urn 1 erhoht), etc. enthalt. Diese Statistik kann 
der GC auswerten, wenn aus Speicherplatzgrunden eine KR 
entfernt werden muft. Fur das Cachen ergeben sich durch 
solche Statistiken erhebliche Vorteile. So kann 
beispielsweise abhangig vom verwendeten Cache- 
Algorithmus, entsprechend den Anforderungen der .. 
Applikation, der Mikrokontroller so programmiert werden, 
daft 

1. die alteste/neueste . KR 

2. die kleinste/groftte KR (s. Eintrag "length") 

3. die am seltensten/am haufigsten aufgerufene KR 
aus dem Cache geloscht wird, wenn freier Speicher 
benotigt wird. Dabei konnen selbstverstandliche weitere 
sinnvolle Statusinf ormationen gespeichert werden. Ein 
derart selektives Cachen ist bei heute bekannten Cache- 
Strukturen nicht moglich. Insbesondere werden frei 
programmierbare Cachealgorithmen in Caches nach dem 
Stand der Technik nicht unterstiitzt. 

Abschliefcend ist eine KR-Statistik vorhanden, die 
beispielsweise die Anzahl der noch nicht konf igurierten 
(REJECT) oder der konf igurierten (ACCEPT) KWs enthalt. 
Gleichzeitig kann die Adresse des ersten noch zu 
konf igurierten KW gespeichert werden. Dies hat den 
Vorteil, dafi bei einem FILMO-Durchlauf direkt auf das KW 
gesprungen werden kann und nicht das komplette KR 
durchlaufen werden muB, was zu einer erheblichen 
Performancesteigerung fuhrt. 

Abschliefiend sei zu den KR angemerkt, daft die 
verketteten Liste vorzugsweise durch Eintrag der 
Vorganger/Nachfolger-ID aufgebaut werden, da damit die 
absoluten Speicheradressen ohne Probleme vom GC 
verschoben werden konnen. Innerhalb einer KR sollten nur 
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relative Sprunge anstatt absoluter Sprunge verwendet 
werden, urn Probleme beim Laden der KR und.bei GC-Laufen 
zu vermeiden, da sich die absolute Adressen dabei 
verandern. 

Der Vollstandigkeit halber soil noch erwahnt werden, dafc 
gemali dem bereits beschriebenen Prinzip auch beim 
Einsatz eines Mikrokontrollers vor dem Ausfiihren einer 
neuen KR (aufgrund eines Triggers oder Befehls, auch von 
einer anderen CT aus) der FILMO durchlaufen wird und vor 
Durchlauf des FILMOs der Zustand der CEL 
(umkonf igurierbar oder nicht) gesichert wird. 

Figuren 

Die nachfolgend beschriebenen Figuren verdeutlichen 
anhand eines Implementationsbeispiels die Verwaltung von 
Konfigurationsdaten nach dem vorgestellten Verfahren: 

Figur 1: Verfahren der Adressgenerierung innerhalb der 
Lookup-Tabellen 

Figur 2-7 Abarbeitung der Befehle und Funktion der 
Statemachinen 

Figur 8: . Aufbau des SCRR-ARB 
Figur 9: Aufbau der LUT1 & LUX 2 

Figur 10: Aufbau der Pointerarithmetik und des CTR 

Figur 11: Aufbau eines FILMO 

Figur 12a: Hierarchische Anordnung der CTs 

Figur 12b: Senden eines Triggers zwischen den CTs 

Figur 12c, d: Methoden zum Senden eines 

Figur 13: Aufruf einer KR durch mehrere IKR 

Figur 14: Aufbau der LUT1 einer ROOT-CT 

Figur 15: Aufbau der HOST-Steuerung einer ROOT-CT 

Figur 16: Verdeutlichung des LUT und ECR Konzeptes 

Figur 17: Ablauf steuerung einer CT mittlerer 

Hierarchieebene, bzw. einer ROOT-CT 
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Figur 18: Deadlockproblematik bei der Konf iguration 

eines 2-dimensionalen Arrays (siehe Pat en the s chr eibung ) . 

Figur 19: Verdeutlichung des FILMO-Konzeptes 

Figur 20: Grundprinzip der Inter-CT-Kommunikation 

Figur 21: Implemetierungsbeispiel der Inter-CT- 

Kommunikation nach dem GETCTS-Verfahren 

Figur 22: Implemetierungsbeispiel der Inter-CT- 

Kommunikation nach dem GETBUS-Verfahren 

Figur 23: Busstruktur des Inter-CT-Bus 

Figur 24: Adressierung innerhalb von CT-Hierarchien 

Figur 25: GARBAGE-Liste . 

Figur 26: FILMO-Liste 

Figur 27:. FILMO Funktion innerhalb einer KR .. 

Figur 28: Speichern der Zustande vor Ausflihren einer KR 

Oder des FILMOs. 

Beschreibung der Figuren 

Figur 1 zeigt den Ablauf der CTR-Adressgenerierung 
innerhalb einer CT. Dabei wird ein eingehender binarer 
Triggervektor (0101) in der LUT1 auf eine gultige KR 
Oder IKR ID ubersetzt. Existiert keine gultige ID, wird 
ein Signal "Illegal Trigger" generiert (0102), das 
anzeigt, dafi der Trigger nicht in LUT1 bekannt ist. Das 
Signal kann als Fehlermeldung an die ubergeordnete CT 
weitergeleitet pder ignoriert werden. Die Ubersetzung 
von "Trigger" nach "ID" wird mittels des Befehls 
"REFERENCE" in die LUT1 eingetragen. 

Eine gultige ID (0103) wird an die LUT2 weitergeleitet. 
IDs die innerhalb von Befehlen, also durch einen 
Operanden, angegeben sind (0104), treffen direkt auf die 
LUT2. Die LUT2 ubersetzt eine eingehende ID in die 
Adresse der KR/ IKR innerhalb des CTR. Ist die KR/IKR 
nicht im CTR gespeichert (es liegt im Cache nicht vor) , 
wird das Signal "Miss" generiert (0105) , Ist die 
iibersetzte Adresse der KR/IKR mit dem Token "NoAdr" 
markiert, wird mit "NoEntry" (0107) angezeigt, daft die 
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Adresse geloscht ist. "Miss" und "NoEntry" zeigen an, 
tfafi eine Ubersetzung auf eine CTR-interne Adresse nicht 
moglich ist. Auf Grundlage dieses Signals ladt die LOAD- 
Statemachine die KR/IKR mit der entsprechenden ID von "'. 
einer daruberliegenden CT nach. 

Sofern eine gultige Adresse vorhanden ist, wird diese an 
die Pointerarithmetik des Adressgenerators 
weitergeleitet (0106) . In LUT1 wird ein eingehender 
binarer Triggervektor entweder in eine ID oder einen 
weiteren Triggervektor ubersetzt, wobei in diesem Fall, 
der Triggervektor ausgegeben wird (0108) . 

In Figur 2 ist der Ablauf beim Laden einer KR/IKR 
dargestellt. Zunachst wird die ID (0201) der zu ladenden 
KR/IKR an die dariiberliegende CT gesendet. Daraufhin 
wird in die LUT2 an der Stelle des Eintrages fur die 
angeforderte ID der Wert des FreePointers (FP) 
eingetragen. FP zeigt auf den Eintrag hinter dem letzten 
fur eine KR/IKR genutzen Eintrag im CTR. Dies ist der 
erste Eintrag, auf den die zu ladende KR/IKR gespeichert 
wird. 

Die Statemachine wartet auf ein Datenwort von der 
driiberliegenden CT. Sobald das Wort verfiigbar ist, wird 
es an die durch FP ref erenzierte Stelle geschrieben. FP 
wird inkrementiert. Zeigt FP auf einen Eintrag hinter 
dem Ende des CTR wird der. erste Eintrag im CTR entfernt 
urn Platz zu schaf fen (0202) ; dabei wird FP aktualisiert . 
1st das von der dariiberliegenen CT gesendet e Datenwort 
"STOP", wird der Ladevorgang abgebrochen (0203), 
ansonsten mit dem Warten auf ein neues Datenwort 
fortgesetzt (0204) . 

In Figur 3a ist der "MASK"-Befehl dargestellt. Der 
Operand des Befehls wird in das MASK-Register 
geschrieben. Das MASK-Register befindet sich am Eingang 
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der Triggersignale vor LUT1 und maskiert ungultige 
Trigger aus . 

In Figur 3b wird durch den Befehl "TRIGGER" der Operand 
des. Be f eh Is als Triggervektor zu den anderen GTs 
abgesendet. 

In Figur 3c wird durch den Befehl "REFERENCE" die 
Ubersetzung eines Triggers zu der entsprechenden KR/IKR 
ID in die LUT1 geschrieben. 

In Figur 4a wir der. Befehl "WAIT" dargestellt . Der 
Operand des Befehls wird in das WAITMASK-Register 
geschrieben. Alle Trigger, bis auf den/die Erwarteten 
und daher in WAITMASK f reigeschalteten werden ignoriert . . 
Erst nach Auftreten des Triggers wird zum Programmf lufi 
zuruckgekehrt . 

In Figur 4b ist der "PUSH"-Bef ehl abgebildet. Das 
Konf igurationswort wird zum adressierten 
konfigurierbaren Element (CEL) gesendet. Akzeptiert das 
CEL das Konf igurationswort nicht; da das CEL sich 
beispielsweise im Zustand "nicht konf igurierbar" 
befindet; wird das Konf igurationswort in den FILMO 
geschrieben (0401) . 

Figur 5 zeigt den Ablauf eines " REMOVE" -Be fehle s . Es 
gibt zwei Auf rufvarianten : 

1. Die erste im CTR liegende KR/IKR wird aus dem CTR 
entfernt . Dem GarbagePointer (GP) wird die Adresse 0 des 
CTR zugewiesen (0501) . 

2. Eine spezifisch durch ihre ID angegebene KR/IKR wird 
aus dem CTR entfernt. Dem GarbagePointer (GP) wird die 
erste Adresse des zu entfernenden KR/IKR im CTR 
zugewiesen (0502) . 

Der MovePointer wird mit dem Wert von GP geladen. GP und 
MP referenzieren auf einen "BEGIN <ID>"-Befehl im CTR, 
auch wenn die erste KR/IKR aus dem CTR entfernt werden 
soli. Die betreffende ID wird in. LUT2 als ungiiltig 
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markiert. MP wird so larige inkrementiert, bis das "BEGIN 
<ID>" des nachsten im Speicher liegenden KR/IKR err^icht. 
wird (0503), ODER MP gleich dem FreePointer (FP) ist, 
das bedeutet, dafl die zu ent f ernende KR/IKR die letzte 
. im. CTR. ist (0504). ... 

- In diesem Fall wird FP mit dem Wert von GP geladen, 
wodurch die durch die zu loschende KR/IKR belegten 
Speicherstellen als frei markiert werden; und die 
Funktion "REMOVE" ist beendet (0505) . 

- Andernf alls ("BEGIN <ID>" wird erreicht (0506)) werden 
die durch MP ref erenzierten Daten an die durch GP 

ref erenzierte Speicherstelle kopiert. MP und GP werden 
inkremetiert . Dieser Ablauf . findet so lange statt, bis 
MP das Ende von CTR Oder die Position von FP erreicht 
hat (0507) . Wird wahrend des Ablauf es durch MP eine 
Speicherstelle ref erenziert, in der "BEGIN <ID>" steht, 
wird der Eintrag fur die entsprechende ID in LUT2 mit MP 
iiberschrieben (0508), damit bei einem Lookup die 
richtige Speicherstelle ausgegeben wird. 

Figur 6 zeigt das Ablauf diagram des FILMOs. Ein FILMO 
beinhaltet drei Pointer: 

1. WriteP: Der Schreibzeiger des FILMO-RAM 

2. ReadP: Der Lesezeiger des FILMO-RAM 

3. FullP: Der Zustandszeiger, der den "Fullstand" des 
FILMO-RAMs reprasentiert und einen Unterlauf, bzw. 
Uberlauf verhindert. 

Ein ein-Bit Register "BeginF" zeigt an, ob sich der 
aktuelle Lesezugriff am Anfang des FILMO-RAMs befindet 
(TRUE), d.h. keine nicht geloschten Eintrage befinden 
sich zwischen dem Lesezeiger und. dem Beginn des FILMO- 
RAMs; Oder sich der Lesezeiger in der Mitte des FILMO- 
RAMS befindet (FALSE), also benutzte Eintrage zwischen 
dem Lesezeiger und dem Beginn des FILMO-RAMS liegen. 
Weiterhin existieren zwei Register zum Speichern der 
Zustande des ReadP und FullP. Es" ist notwendig beim 
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Auftreten des ersten ungeloschten Eintrages die beiden 
Register zu sichern, da bei einem spateir stattf indepden 
Lesezugriff an der Stelle dieses Eintrages mit dem 
Ausiesen begonnen werden muft. Andererseits mussen jedoch 
ReadP und FullP wahrend des aktuellen Lesevorganges 
weiterhin modifiziert werden, ura die nachsten 
Leseadressen zu erhalten, bzw. das Ende des FILMO-RAMs 
festzustellen. Durch den Aufbau des FILMOs als FIFO- 

ahnliche Struktur als sogenannten Ringspeicher 

kann Beginn und Ende des Speichers nicht anhand einer 
Adresse 0 oder eine Maximaladresse festgelegt werden. 
Aus dem Grundzustand fuhren zwei Ablaufpfade: 
1. Lesepfad (0601) 

FullP und ReadP werden in die Register gesichert. 
Die Abarbeitungsschleife beginnt: 
BeginF ist TRUE. 

1st FullP gleich 0, werden ReadP und FullP aus ihren 
Registern zuruckgelesen (0602) und die Statemachine 
springt in den Grundzustand zuriick. 

Ansonsten (0603) wird getestet, ob der Eintrag im FILMO, 
auf den ReadP zeigt gleich "NOP" ist, d.h. es handelt 
sich urn einen als geloscht markierten Eintrag in der 
Mitte des FILMOs. Ist dies nicht der Fall (0604) wird 
versucht den Eintrag in das konf igurierbare Element 
(CEL) zu schreiben. Gelingt dies nicht (REJECT, 0605), 
da CEL nicht umkonf igurierbar ist, wird BeginF auf FALSE 
gesetzt, FullP dekrementiert und ReaidP inkrementiert . 
Die Statemachine springt an den Beginn der 
Abarbeitungsschleife (0606) . 

Gelingt das Schreiben des Eintrages an das CEL (0607), 
oder der Eintrag ist ein NOP, wird BeginF gestestet: 
BeginF -= TRUE (0608) : Es liegen keine ungeloschten 
Eintrage vor diesem. FullP wird inkrementiert, ReadP 
wird in dem zugeordneten Register gesichert, um den 
neuen Anfang des FILMOs f estzuhalten . FullP wird 
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gesichert urn die aktuelle Datenmenge festzuhalten; ReadP 
wird inkrementiert. 

BeginF == FALSE (0609): FullP wird inkrementiert und der 
aktuelle Eintrag irri FILMO-RAM mit NOP iiberschrieben, 
d.h. der Eintrag wird geloscht. ReadP wird 
inkrementiert . 

In beiden Fallen springt die Statemachine an den Beginn 
der Abarbeitungsschleif e . 
2. Schreibpfad (0610) 

Es wird getestet, ob der FILMO-RAM vo 11 ist, indem FullP 
auf den maximalen Wert iiberpruft wird. Ist dies der Fall 
(0611), wird in den Lesepfad gesprungen urn Platz zu 
schaffen. 

Ansonsten wird das Datenwort in den FILMO-RAM 
geschrieben und WriteP und FullP inkrementiert. 

Figur 7 zeigt den Ablauf in der Hauptstatemachine . Der 
Grundzustand (IDLE) wird verlassen, sobald ein 

1. REMOVE-Koiranando von der dariiberliegenden CT auftritt 
(0701) : Der REMOVE-Bef ehl wird ausgefuhrt und die 
Statemachine kehrt nach IDLE zuruck. 

2. Ein Triggersignal zur Generierung eines Triggers 
zwischen den CTs auftritt (0702) : 

Der Trigger wird ausgegeben. 

Die Statemachine springt in den "STOP "-Bef ehl und danach 
nach IDLE zuruck. 

3.. Ein Triggersignal zur Ausfuhrung eines KR/IKR <ID> 
auftritt (0703) : 

Der ProgramPointer (PP) wird mit der durch LUT2 
generierten Adresse geladen. Ist die Adresse ungultig, 
d.h. kein Eintrag fur das zu ladende KR/IKR vorhanden, 
wird dieses geladen (0704) und PP neu gesetzt. 
Die Ausfiihrungsschleife beginnt: 

PP wird inkrementiert (beim ersten Schleifendurchlauf 
wird dadurch der BEGIN <ID>-Befehl ubersprungen) , das 
Auftreten weiterer Trigger wird unterbunden, RECONFIG 
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wird gesperrt. Die Befehle werden ausgefiihrt und zum 
Beginn der Ausfuhrungsschleife gesprungen (0707). 
Der Befehl "STOP" wird gesondert ausgefiihrt (0705). Die 
Trigger , und RECONFIG werden wieder f reigeschaltet und ' : 
die Statemachine springt nach IDLE . . 

Der Befehl "EXECUTE" wird ebenfalls gesondert ausgefiihrt 
(0706) . Die in EXECUTE <ID> angegebene ID wird in das 
ID-REG geschrieben. PP wird neu geladen und die durch ID 
angegebene KR/IKR ausgefiihrt (0708) . 

Nach einem Reset der CT wird die Grundkonf iguration in 
das CTR geladen und direkt in die. Ausfuhrung der 
Grundkonf iguration gesprungen (0709) . 

Figur 8 zeigt den Aufbau eines SCRR-ARB. Die zu 
arbitrierenden Signale gelangen uber Dataln auf eine 
Maske (0801), die gemafi der bekannten Tabelle einen 
zusammenhangenden Teil der Signale durchschaltet , bzw. 
sperrt. Ein gewohnlicher Prioritatsarbiter (0802) nach 
dem Stand der Technik arbitriert ein Signal aus der 
Menge der Durchgeschalteten und lieferte dessen 
Binarvektor (BinaryOut) zusammen mit einer 
giiltig/ungultig-Kennung (ValidOut) (ebenfalls gemaft dem 
Stand der Technik) als Ausgang des SCRR-ARB. 
Dieses Signal wird gemaft der bekannten Tabelle dekodiert 

(0803) und auf ein Register zur Taktsynchronisierung 

(0804) gefuhrt. Uber dieses Register wird die Dataln 
Maske geschaltet. Dabei wird das Register entweder durch 
einen Takt Oder ein Next-Signal (Enable EN) , das den 
nachsten gliltigen Binarvektor abfragt gesteuert. Bei 
einem Reset Oder wenn die Kennung (ValidOut) ungiiltig 
anzeigt wird das Register so geschaltet, dafi die Dataln 
Maske alle Signale durchschaltet. 

Der Aufbau der Maske ist in 0805 dargestellt. In 0806 
ist die Maske ein weiteres Mai abgebildet, dabei sind 
die Signale Dataln 0.. Dataln 1 gemafi des SCRR-Prinzips 
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gleichpriorisiert, wahrend Datain m .'. Datain n 
hoherpriorisiert sind. 

In Figur 9 ist die LUT-Struktur abgebildet . Der 
Binarvektor . -(Binary In) - des arbitrierten Triggers wird: 
auf den Adresseingang der LUT1 (0901) gef uhrt . 
LUT1 iibersetzt den Binarvektor entweder in einen 
gultigen Trigger um diesen an eine andere CT 
weiterzuleiten oder eine* gultige ID. Beide werden uber 
0910 ausgegeben. 0911 zeigt an, ob es sich um einen . 
Trigger oder eine ID handelt. 

1st uber den Befehl "REFERENCE" keine Ubersetzung des 
eingehenden Binarvektors in LUT1 eingetragen, wird - — 
mittels eines Biteintrages oder eines Vergleichers auf 

ein bestimmtes Token (z.B. "VOID") das Signal 

"Illegal Trigger" 0914 generiert. 

Ein Trigger wird uber 0912 an externe CTs gef uhrt, IDs 
werden uber den Multiplexer (0902) weiterverarbeitet . 
0902 schaltet entweder der Datenausgang von LUT1, der 
eine gultige ID angibt, oder das ID-Register (0903) der 
CT auf den Adresseingang der LUT2 (0904) . 0904 besitzt 
eine Cache-ahnliche Struktur, d.h. der niederwertige 
Teil (0906) des Datenausgangs von 0902 wird auf den 
Adresseingang von 0904 geschaltet, wahrend der 
hoherwertige Teil (0907) auf den Dateneingang von 0904 
geschaltet wird. Der 0907 gehorende Datenausgang wird 
uber einen Komparator (0905) mit 0907 verglicheh. Der. 
Vorteil dieses Verfahrens ist, daB 0904 nicht die Tiefe 
zur Ubersetzung aller IDs aufweisen mufc, sondern 
erheblich kleiner ausf alien kann. Ahnlich eines 
gewohnlichen Caches wird lediglich ein Teil der IDs 
iibersetzt, wobei in der LUT2 anhand 0907 festgestellt 
werden kann, ob die selektierte ID der von LUT1 
angegebenen entspricht. Dies entspricht einem Cache/TAG- 
Verfahren nach dem Stand der Technik. 
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Einem zweiten Dateneingang von 0904 ist ein Multiplexer 

0908 zugeordnet, der je nach Operation den FreePointer 
(FP, Operation LOAD) , den GarbagePointer (GP, Operation 
REMOVE). Oder eine invalid-Kennung/Token (NoAdr, 
Operation REMOVE) zur Speicherung an LUT2 liefert. Die 
beiden Pointer ref erenzieren auf Speicherstellen im CTR, 
"NoAdr" gibt an, daft kein Eintrag zu der passenden ID 
existiert, der Eintrag geloscht wurde . Dies wird am 
Datenausgang f estgestellt, indem uber den Vergleicher 

0909 die Daten auf das Token "NoAdr" verglichen werden. 
An die Statemachine wird weitergeleitet : 

- Das Auftreten eines Binarvektors wird uber "Validln" 
(vgl. Figur ,8) . .... 

- Die Angabe ob es sich bei der Ubersetzung in LUT1 urn 
einen Trigger oder eine ID handelt (0911, "Trigger/ID 
Out"). Trigger werden uber 0912 an andere CTs 
weitergeleitet, IDs werden in der eigenen CT 
abgearbeitet und an die LUT2 weitergeleitet. 

- Das Ergebnis von 0905, das angibt, ob die 
entsprechende ID in 0904 gespeichert ist ("Hit/Miss 
Out"). 

- Das Ergebnis von 0909, das angibt, ob die 
entsprechende ID auf eine giiltige Adresse im CTR zeigt 
("NoEntry Out") . 

Die von 0904 generierte Adresse wird an das CTR 
weitergeleitet ("CTR Address Out") . 

Die LUT1 wird uber den Befehl "REFERENCE" mit der 
Ubersetzung des eingehenden Binarvektors auf einen 
Trigger oder ID geladen. Die Operanden des Befehls 
werden uber den Bus 0913 an die LUT1 gefiihrt. Uber 
denselben Bus wird das ID-Register (0909) geladen. 

Figur 10 zeigt die Pointerarithmetik des GarbagePointer 
(PG), ProgramPointer (PP) , MovePointer (MP) und 
Fre.ePointer (FP) . Jeder Pointer besteht aus einem 
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getrennt ansteuerbaren ladbaren up/down-Zahler. Jeder 
Zahler kann — sof ern notwendig — - mit dem t Wert . je.des. 
anderen Zahlers geladen werden; ebenso wie mit der 
Ausgabe von LUT2 (1007) . 
Uber Vergleicher wird festgestellt ob 

1. PP gleich MP 

2. MP gleich FP 

3. FP gleich der maximalen Position im CTR 
ist. Die Ergebnisse werden zur Steuerung der 
Statemachines verwendet . 

Uber einen Multiplexer (1001) wird einer der Pointer zum 
Adresseingang des CTR geleitet. Die Daten gelangen uber 
einen Multiplexer (1002) entweder von der ubergeordneten 
CT (1005) Oder aus einem Register (1003) an das CTR. Zur 
Statemachine und zum FILMO (1006) werden iiber einen 
Multiplexer (1004) entweder die Daten von der 
ubergeordneten CT oder des CTR weitergeleitet . Dabei 
wird beim Auftreten eines REMOVE-Bef ehls von der 
ubergeordneten CT der direkt iiber 1004 an die 
Statemachine geleitet, wahrend ansonsten die Befehle aus 
dem CTR an die Statemachine gefiihrt werden. Das Register 
1003 dient zur Speicherung und Ruckkopplung von Befehlen 
auf den CTR Eingang, die wahrend eines Durchlaufs des 
Garbage-Kollektors von einer Adresse an eine andere 
geschoben werden. 

Der Aufbau eines FILMOs ist in Figur 11 dargestellt / Die 
Daten gelangen von dem CTR (1101) in das FILMO und 
werden entwerder uber den Multiplexer (1102) in das 
FILMO-RAM (1103) geschrieben oder iiber den Multiplexer 

(1104) an die konf igruierbaren Elemente (1116) gesendet. 
Werden Daten in 1103 geldscht, wird Uber 1102 eine 
"NOP"-Token nach 1103 geschrieben. Uber den Vergleicher 

(1105) am Datenausgang wird das n NOP H -Token erkannt und 
ein Schreiben zu den konf igurierbaren Elementen 
verhindert. Uber den Multiplexer 1106 wird entweder der 
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Schreibzeiger WriteP (1107) oder der Lesezeiger (1108) 
an den Adresseingang yon 1103 gefuhrt. In dem Register ... 
1109 wird der Lesezeiger gesichert urn ein Rucksetzen 
(siehe Figur 6) zu ermoglichen. 

Der Fullstandszahler Full (1110) von 1103 wird gemafc 
Figur 6 in dem Register 1111 zum Rucksetzen gespeichert. 
Zwei Vergleicher testen, ob 1103 leer (1112) oder voll 
(1113) ist. Uber den Multiplexer 1115 wird selektiert, 
ob die Steuersignale der Statemachine (von 1101) oder 
des FILMOs an 1116 gesendet wird. .. .. 

Figur 12a zeigt den hierarchischen Aufbau der CTs. Alle 
CTs beziehen. ihre Daten aus der ROOT-CT 11201) und dem 
ihr zugeordneten ECR (1204). Fur jede 

Implementierungsebene in einem Baustein existiert eine 
oder mehrere CTs. Jede CT ist fur die Verwaltung ihrer 
Ebene und der darunterliegenden CTs zustandig. Es ist 
nicht notwendig, dafi alle Aste das Baumes gleich tief 
sind. Beispielsweise konnen weniger Ebenen zur Steuerung 
der Peripherie (1202) eines Bausteines existieren als 
zur Steuerung der Arbeit seinheiten (1203) . Der 
Datentransfer erfolgt baumartig. Jede CT arbeitet als 
Cache fur alle unter ihr liegenden CTs. 
Figur 12b zeigt den Trigger flufl zwischen den CTs. 
Wahrend der DatenfluA baumartig verlauft, ist der 
Triggerflufi nicht festgelegt. Jede CT kann an jede 
andere einen Trigger senden . Fur gewohnlich findet ein. 
Triggeraustausch nur von den Blattern (1203) in Richtung 
der ROOT-CT (1201) statt. Unter Umstanden kann der 
Transfer jedoch auch in die entgegengesetzte Richtung 
verlaufen. 

In Figur 12c ist ein Triggervektor Broadcast 
dargestellt, wobei 1205 einen Triggervektor an alle CTs 
sendet . 



51 



WO 99/44147 



PCT/DE99/00504 



Figur 12d zeigt einen HIGHER-Triggervektor, den 1206 an 
die liber ihr liegende CT sendet. 1207 sendet einen 
LOWER-Triggervektor an alle unter ihr liegenden CTs. 
12.08 ube'rtragt einen direkt adressierten (ADDRESSED) - ' 
Triggervektor an eine bestimmte CT, die nicht, direkt mit 
1207 verburiden ist. 

In Figur 13 fordern zwei unabhangige IKR n und m eine 
gemeinsame, in der daruber liegenden CT gecachte KRx an. 
Es ist angedeutet, da!5 diese KR von dem gesamten Ast 
gecachet wird und auch in einem Nachbarast (1301) uber 
eine gemeinsame CT verfligbar ist. 

Figur 14 zeigt ein gegenubef Figur 9 modif iziertes LUT- 
System, das in ROOT-CTs und CTs mittlerer 
Hierarchieebenen verwendet wird. Der grundlegende 
Unterschied zu den bislang beschriebenen CTs ist f dafc 
anstatt einzelner Triggersignale ID- und/oder Trigger- 
Vektoren von der CT verwaltet werden miissen. Jedem 
Vektor ist dabei ein Handshake-Signal (RDY) zur Anzeige 
der Gultigkeit des Vektors zugeordnet, die an einen 
Arbiter (1401) geleitet werden. Uber die Multiplexer 
(1402, 1403) wird entweder einer der Triggervektoren 
(1404) oder einer der ID-Vektoren (1405) ausgewahlt. 
Triggervektoren gelangen direkt auf den Adresseingang 
der LUT1 (1406), die ansonsten gemafi Figur 9 beschaltet 
ist. Das ID-Register (1407) ist ebenfalls gemaA Figur 9 
beschaltet. Im Gegensatz zu Figur 9 besitzt der 
Multiplexer 1408 drei Eingange (vgl. 0902).. Der 
Multiplexer wird dabei aufier von der Statemachine 
zusatzlich von dem Arbiter 1401 angesteuert. Uber den 
zusatzlichen Eingang werden ID-Vektoren liber 1403 direkt 
an die LUT2 weitergeleitet . Dazu dient der Bus 1409. 
(Prinzipiell konnen auch bei CTs gemafc Figur 9 IDs gemafi 
einem Multiplexer (1408) direkt auf die LUT2 geschaltet 
werden. Die IDs konnen dann ohne Ubersetzung direkt von 
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den CEL an die LUT2 gesendet werden.) "Trigger/ ID Out" 
wird gemaB Figur 9 gener iert Ein "Validln" Signal, das. 
gemafi Figur 9 auf ein "Valid Out" weitergeleitet wird 
existiert riicht. Statt dessen wird je nach Arbitrierung 
durch 1401 ein "Valid. Trigger Out * . fur Triggervektoren 
und ein "Valid ID Out" fiir ID-Vektoren generiert, um die 
Statemachine anzuweisen, wie die Verarbeitung 
stattzuf inden hat. 

Der Bus 1409 wird uber 1410 an eine weitere Einheit 
geleitet, die nur in der ROOT-CT existiert und in Figur 
15 beschrieben ist. 

Eine ROOT-CT benotigt zusatzlich zu den normalen CT- 
Funktionen ein Interface zu dem externen 
Konfigurationsspeicher (ECR) , sowie den erf orderlichen 
Adressgenerator und Einheiten zum Verwalten der Zugriffe 
auf den ECR. 

Eine gewohnliche CT libersetzt in LUT1 eingehende 
Triggervektoren auf einen ID und in LUT2 das ID auf eine 
Speicherstelle im CTR (siehe Figur 16a) . Eine ROOT-CT 
iibersetzt bei Zugriffen auf das ECR eine ID innerhalb 
des ECR auf eine Adresse im ECR, an der das durch ID 
referenziert KR/IKR beginnt. Dazu ist ein 
Speicherbereich im ECR festgelegt, dessen Grotie der 
moglichen Anzahl an IDs entspricht (ist beispielsweise 
eine ID 10-bit breit, ergibt das 2 10 = 1024 mogliche IDs f 
also werden 1024 Eintrage im ECR reserviert) . In den 
folgenden Beispielen befindet sich dieser 
Speicherbereich am unteren Ende des ECRs und wird LUT- 
ECR genannt, um die Ahnlichkeit zur LUT2 zu 
unterstreichen. Die Ubersetzung eines Triggers auf eine 
ID findet dabei gemaii den bereits bekannten CTs in der 
LUT1 statt (1601) . Zum besseren Verstandnis verdeutlicht 
Figur 16b den Zugriff auf das ECR. 
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Eine ID gelangt in Figur 15 iiber den Bus 1410 auf Figur 
14 an den Multiplexer 1501. Uber 1501 wird die ID in den 
ladbaren Zahler 1502 geschrieben. Der Ausgang von 1502 
fiihrt liber einen Multiplexer 1503 an den Adressbus 
(1504) des ECR. Uber den Datenbus 1505 gelangt die , 
Ubersetzung der ID auf eine Speicheradresse uber einen 
Multiplexer/ Demultiplexer (1506) an 1501, der 1502 mit 
der Speicheradresse ladt. Daraufhin werden iiber die 
Statemachine LOAD-ECR (siehe Figur 17) die Datenworter 
der entsprechenden KR/IKR aus dem ECR gelesen und in das 
CTR geschrieben, wobei 1502 nach jedem Lesevorgang 
erhoht wird; so lange, bis der Befehl "STOP" gelesen 
wurde. 

iiber das Interface 1507 schreibt der ubergeordnete HOST 
iiber 1503/1506 die KR/IKR in das ECR. Dabei wird iiber 
die Statemachine (CTS) arbitriert, ob der HOST oder die 
ROOT-CT Zugriff auf das ECR hat. 

Nach einem Reset des Bausteines mufi eine 
Grundkonfiguration (BOOT-KR) geladen werden. Dazu wird 
eine feste Speicheradresse (BOOT-ADR) eingefuhrt, die 
auf die erste Speicherstelle der BOOT-KR zeigt. Als 
BOOT-ADR wird die Speicherstelle Oh empfohlen, sofern 
die IDs bei 1 beginnen, andernfalls kann 2 1D oder irgend 
eine andere Speicherstelle verwendet werden. In dem 
Ausfuhrungsbeispiel wird 2 ID verwendet. 

Die ROOT-CT fiihrt zum Laden der BOOT-KR an der Stelle 
BOOT-ADR einen Lookup durch, sofern eine BOOT-KR geladen 
ist. Die ROOT-CT schreibt die Daten nach 1502 um von 
dort die BOOT-KR bis zum Auftreten eines "STOP" Befehls 
zu laden. 

Eine Uberwachungseinheit innerhalb der ROOT-CT iibernimmt 
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die Synchronisation des HOST mit dem Baustein. Dies 
geschieht f olgendermafien: 

Die Adressen kleine 2 10 werden durch 1508 iiberwacht, d.h. 
bei Zugriffen auf diese Adressen durch den HOST wirdein 
Signal (ACC-ID) an. die Statemachine (CTS) gesendet. 
Ebenfalls wird BOOT -ADR uber 1509 iiberwacht und sendet 
ein Signal ACC-BOOT an die Statemachine (CTS) . 
Die Statemachine (CTS) reagiert wie folgt: 

- Schreibt HOST auf die BOOT-ADR, bewirkt dies das Laden 
der BOOT-KR. 

- Schreibt HOST das Datenwort 0 (1512) auf die BOOT-ADR, 
wird dies iiber.den Komparator 1510 festgestellt und 
bewirkt das Anhalten des Bausteines . 

- schreibt der HOST auf eine Adresse kleiner 2 ID wird die 
Adresse in das REMOVE-Register (1511) geladen. Da die 
Adresse der ID entspricht (siehe ECR-LUT) steht die ID 
der geanderten KR/IKR in 1511. An alle CTs wird der 
Befehl REMOVE <ID> zur sofortigen Ausfuhrung gesendet 
(1513) . Die CTs loschen daraufhin die KR/IKR der 
entsprechenden ID aus ihrem CTR, bzw. LUT2 . Bei einem 
nachfolgenden Aufruf der KR/IKR mussen die CTs 
zwangslaufig die neue KR/IKR aus dem ECR laden. 

Figur 17 zeigt den Ablauf in einer ROOT-CT bei Laden 
einer KR/IKR aus dem ECR. Befindet sich eine ID nicht im 
internen CTR (vgl. Figur 1, 1701) wird die ID in den 
Zahler 1502 geschrieben (1703) . Ein Zugriff auf das ECR 
mit der Adresse in 1502 liefert die Basisadresse der 
KR/IKR. Diese wird in 1502 geschrieben (1704). Ein LOAD 
gemaA Figur 2 findet statt (1702). Dabei werden die 
Daten statt von einer Ubergeordneten CT aus dem ECR 
gelesen (1705) und nicht nur in das eigene CTR 
geschrieben, sondern an die untergeordnete CT gesendet 
(1706) . 
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In einer CT mittlerer Hierarchieebene iMuft die 
Ubersetzung der Trigger ahnlich Figur i, .'mit der 
Ausnahme, dafi Triggervektoren und ID-Vektoren gemafi 
Figur 14 behandelt werden/ Die KR/IKR werden gemali Figur 
2 geladen, mit der Ausnahme, dafi die Datenworte nicht 
nur in das eigene CTR geschrieben werden (0210) , sondern 
gleichzeitig an die untergeordnete CT gesendet werden. 

Figur 19 verdeutlicht das FILMO Prinzip. Der FILMO 
(1901) wird bei lesenden und schreibenden. Zugriffen. 
immer vom Anfang zum Ende durchlaufen (1902) . Werden 
Eintrage. vom .Anfang des FILMOs geschrieben und geloscht 
(1903), wird der Lesezeiger auf den ersten ungeloschten 
Eintrag verschoben (1904). Werden Eintrage aus der Mitte 
das FILMOs geschrieben (1905), bleibt der Lesezeiger 
unverandert (1906), die Eintrage werden mit "NOP" 
markiert (1907) . Werden Daten in das FILMO geschrieben 
(1908), werden diese am Ende, hinter dem letzten Eintrag 
angehangt (1909) . Der Lesezeiger (1910) bleibt 
unverandert . 

Selbstverstandlich kann eine CT mit nur einem Speicher, 
der LUT1, LUT2 und CTR umfa&t aufgebaut werden. Die 
Steuerung dafur ist jedoch aufwendiger. Die CTs sind 
dabei ahnlich der ROOT-CT aufgebaut, die bereits die 
LUT2 UND das CTR im ECR integriert . Fiir das Verstandnis 
des Verf ahrens ist. eine Beschreibung dieser CTs nicht 
erforderlich. 

Wird eine CT als Cachesystem fiir Daten eingesetzt, 
werden Trigger zum Schreiben von Daten in das CTR 
eingefuhrt. Dabei werden die Daten von einer CEL in das 
CTR geschrieben. Die hierzu notwendigen Anderungen sind 
trivial, das FILMO kann komplett ent fallen. 
Beim Cachen der Daten tritt das Problem der 
Datenkonsistenz auf. Dies kann umgangen werden, indem 
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ein Verfahren gemaB DE 42 21 278 Al eingesetzt wird, urn 
die Daten und deren Gultigkeit in den einzelnen 
Hierarchieebenen zu kennzeichnen. Werden Daten zur ' 
. Durchfuhrung eines Read-Modif y-Write-Zyklusses (RMW- 
Zyklus) angefordert, . werden die Daten auf alien 
Hierarchieebenen anhand eines zusatzlichen Eintrages in 
dem CTR/ECR als "ungiiltig" (INVALID) gekennzeichnet . In 
den Eintrag kann dazu die eindeutige ID der die Daten 
benutzenden KR/IKR eingetragen werden. Die Daten konnen 
so lange von keiner KR/IKR mit anderer ID benutzt 
werden, bis die die Daten benutzende KR/IKR die Daten 
zuruckgeschrieben (vgl. Write-Back-Methode nach dem 
Stand der Technik) und ihre ID geloscht hat, 

Figur 20 zeigt ein Ausf uhrungsbeispiel : 
In Figur 20a fordert die CT 2007 Daten von der 
daruberliegenden CT an, diese fordert die Daten von der 
ROOT-CT 2004; mit der Datenanf orderung wird die ID der 
Anfordernden KR/IKR (2001) ubertragen. Die Daten (2002) 
werden an 2007 gesendet. Alle anderen, spateren Zugriffe 
werden abgewiesen (2003) . 

In Figur 20b werden die Daten zuruckgeschrieben (2005), 
anderen, spateren Zugriffe werden wieder akzeptiert 
(2006) . 

In Figur 20c werden Daten von einer CT mittleren 
Hierarchie angefordert, im Besitz der Daten ist und 
diese an 2007 sehdet . Die ID zum Sperren der Daten wird 
an alle CTs in der Hierarchie gesendet (2001) . Beim 
Riickschreiben der Daten (Write-Back) in Figur 20d werden 
die Daten an alle CTs in der Hierarchie geschrieben und 
die ID geloscht, 

Figur 21 zeigt die Kommunikation einer INITIATOR CT 
(2101) uber mehrere Zwischen-CTs (2104, 2105, 2106) mit 
einer TARGET CT (2102), sowie die direkte Kommunikation 
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ohne Zwischenebenen rait einer TARGET CT (2103) nach dem 
GETCTS/LOOSECTS-Verf ahren . 

2101 baut eine Verbindung zu 2103 auf. Nach 
erfolgrei'cheh Aufbau erhalt 2101 von 2103 einen GRANT 
als Bestatigung. des Aufbaus . Danach baut 2101 liber 2104, 
2105, 2106 die Verbindung zu 2102 auf. Die Verbindung zu 

2102 wird erst bestatigt (GRANT), wenn 2102 erreicht 
ist. 

1st die Verbindung nicht aufbaubar, da einer der Busse 
belegt ist, wird ein REJECT an 2101 gesendet und 2101 
bricht den Vorgang ab. Das bedeutet, daft auch die 
Verbindung zu 2103 abgebrochen wird und ein REJECT. an 

2103 gesendet wird. 

Bestatigt 2102 jedoch die Verbindung mit GRANT, sendet 

2101 an 2103 und 2102 eine GO-Befehl, urn gleichzeitig 
2103 und 2102 den gelungenen Busaufbau und die 
Synchonisation zu bestatigen. Durch dieses Protokoll 
sind Daten oder Befehle synchron und deadlockfrei 
iibertragbar, da uber GO sichergestellt ist, daft alle 
TARGET die Befehle korrekt erapfangen. 

Figur 22 zeigt den Ablauf der Inter-CT-Kommunikation 
nach dem GETBUS/LOOSEBUS-Verf ahren . Wahrend im Verf ahren 
gem. Fig, 21 die jeweils libergeordneten CTs die 
steuernde und priorisierende Aufgabe besitzen, wird die 
Steuerung hier von den Inter-CT-Bussen (2201) 
libernommen. .. 

Eine Verbindung zu 2103 wird aufgebaut, indem die 
INITIATOR-CT (2101) ihren lokalen Inter-CT-Bus anfordert 
(2202). Anforderungen werden bestatigt, wenn der Bus 
frei ist (ACCEPT) oder zuriickgewiesen, wenn der Bus 
belegt ist (REJECT) . Danach sendet sie die Adresse von 

2102 auf den Bus. Gemafi dem Adressierungs schema erkennt 
die Bussysteuerung, daft die Adresse aufterhalb der 
lokalen Busadressen liegt und baut uber die 
ubergeordnete CT 2104 eine Verbindung zu deren lokalem 
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Bus auf (2203). Da die Adresse von .2102 . in dessen 
Adressbereich liegt , wird uber 2106 die Verbindung, zum 
lokalen Bus von 2102 aufgebaut (2204). Da 2101 nunmehr 
alleinxger Busmaster samtlicher fur die 
Datenkommunikation erf orderlicher Busse ist, ist 
sichergestellt, daft eine reibungslose deadlockf reie 
Kommunikation ablauft, da die Kommunikationskanale fur 
alle anderen CTs gesperrt sind. Auch 2102 und 2103 
konnen die Busse nicht benutzen, da diese in ihrer 
TARGE T -Ro lie nur Befehle empfangen konnen und nur auf 
Anforderung durch den INITIATOR (2101) selbst Daten 
senden konnen. 

Sobald die Kommunikation beendet ist, werden die Busse 
durch ein Signal von 2101 abgebaut. 

Trifft 2101 wahrend des Busaufbaus auf einen benutzten 
Bus, wird ein REJECT an 2101 gesendet und 2101 baut die 
Bussysteme wieder ab und versucht den Aufbau zu einem 
spateren Zeitpunkt erneut. Forderen mehrere CTs 
gleichzeitig denselben Bus an, so ist die uberliegende 
CT hoher priorisiert (2205) . Damit wird vermieden, daB 
ein weit f ortgeschrittener Busaufbau, der bereits uber 
mehrere Ebenen lauft von einem noch sehr lokalen 
Busaufbau abgebrochen wird. 

Durch ein erweitertes Protokoll ist es moglich im Falle 
eines REJECTS nur die Busse abzubauen, die von dem hoher 
priorisierten Busaufbau benotigt werden. Dies kann zu 
einer erheblichen Perf ormancesteigerung fuhren, da nicht 
alle Busse zu einem spateren Zeitpunkt neu aufgebaut 
werden miissen. 

Der Aufbau des Inter-CT-Busses fur das Verfahren gem. 
Fig, 22 ist in Figur 23 dargestellt. Die CTs 2301-2304 
sind liber ihre Interface (2308-2311) zusammen mit der 
iibergeordneten CT 2305 (Interface 2307) an den Inter-CT- 
Bus 2312 angeschlossen. Die Aufschaltung auf den Inter- 
CT-Bus geschieht uber einen Round-Robin-Arbiter, der 
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2308-2311 gleich priorisiert und 2307 hoher priorisiert, 
der einen Multiplexer zum Zusammenschalten der Busse 
ansteuert (2306) . Dem Arbiter zugeordnet ist ein 
/Statemachihe, die die Steuersignale (z.B. Auf/Abbau, 
ACCEPT, REJECT. ... ) auswertet . 

Figur 24 zeigt den Aufbau des Adresschemas eines 
eindimensionalen CT-Baumes. Die Rechtecke symbolisieren 
eine CT. Dabei ist die Adresse der CT eingetragen. - 
kennzeichnet unrelevante Adressbits, die nicht 
ausgewertet werden, die relevanten Adressbits sind mit 
binarer 0 oder 1 angegeben, * steht fur jedes beliebige 
Adressbit. Es ist leicht nachvollziehbar, dafl durch . 
Projektion dieses Schema auf mehrdimensionale Baume 
ebenso angewendet werden kann, dabei stellen die 
angegebenen Adressen jeweils eine der Achsen dar; mit 
anderen Worten, pro Achse existiert ein entsprechendes 
separates Adressystem. 

Figur 24a zeigt die Adressierung von CT 0001 aus. Dabei 
ist die relative Adresse -1 angegeben. Durch die 
Berechnung -1+1 = 00 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene"), kann die CT 0000 
berechnet werden, die auf denselben lokalen Bus 
geschaltet ist. 

In Figur 24b ruft die CT 0010 die relative Adresse +10 
auf. Die Berechnung 10+0 « 10 ("relative Bewegung" + 
. / "Adresse. der INITIATOR-CT auf. aktueller Ebene" ) ergibt 
den Ubertrag 1, da der Adressbereich des niedersten 
lokalen Busses genau ein Bit breit ist. Dadurch wird der 
nachst hohere Bus selektiert. Dessen Adressberechnung 
ergibt mit 10+10 - 100 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene") erneut einen 
Ubertrag, da dessen Adressbereich mit 2 Bit urn genau 
eins grofier ist, als der Adressbereich des niedersten 
Busses. Auf der nachsthoheren Ebene tritt bei der 
Berechnung 10 + 010 = 0100 kein Ubertrag auf, sodafc das 
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3. Bit (von links) den Pfad 1** mit der nachst tieferen 
Ebene adressiert, das 2. Bit (von links) den Pfad 10* 
der wiederum nachst niedersten Ebene adressiert. und 
schlieBlich das letzte Bit die TARGET-CT selektiert . 
Figur 24c zeigt das bekannt Verfahren uber 2 Ebenen in 
positive Richtung und Figur 24d zeigt das Verfahren uber 
drei Ebenen in negativer Richtung mit negativem 
Uberlauf . 

Figur 25 zeigt den Aufbau eines 2-dimensionalen CT- 
Baumes. Auf der untersten Ebene (2502) befinden sich 2- 
dimensional angeordnet die CTs (2501) . Die Adresse der 
Dimension ist mit x/y in der jeweiligen CT angegeben. 
2502 ubergeordriet ist die nachsthohere Ebene (2504). 
Deren CTs (2503) steuern jeweils eine Gruppe von 4 CTs 
der Ebene 2502. Der Adressraum der CTs auf 2504 ist um 
ein Bit weiter, * kennzeichnet die Adressbits der Ebene 
2502, die fur die Selektion der CTs auf 2504 irrelevant 
sind. 2504 iibergeordnet befindet sich die ROOT-CT 2505. 
Deren Adresse ist wiederum um ein Bit weiter, die 
Bedeutung von * ist Equivalent. 

Figur 26 zeigt die Verkettung des Garbage-Kollektors bei 
der Mikrokontroller-Implementierung. Dabei sind 
samtliche KRs rniteinander uber die HeadereintrSge 
(garbage-previous /garbage-next) rniteinander verkettet. 
Beim Durchlauf en des Garbage-Kollektors durch die Liste, 
wird das Alter der KR durch Erhohen des Eintrages um 
(+1) fur die Cache-Statistik (2602) protokolliert . Der 
Garbage-Kollektor achtet auf den Eintrag KR-Statistik 
(2601), der anzeigt, ob die KR noch in der FILMO-Liste 
hangt. In diesem Fall darf die KR nicht von GC geloscht 
werden, da sie noch unkonf igurierte KW enthalt . 
Alternativ konnte dieser Test auch uber die Eintrage 
FILMO-next und FILMO-previous ablaufen. 
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In Figur 27 ist die Verkettung der FILMO-Liste 
dargestellt. 

Dabei kann die Verkettung eine vollkoiranen andere als in 
der Garbage-Liste (fig. 26) sein. Die KRs sind uber 
FILMO-previous und FILMO-next verkettet. Die Eintrage 
KR-Statistik (2701) zeigen auf das jeweils erste noch 
nicht konfigurierte KW in der jeweiligen KR. Ein FILMO- 
Lauf gestaltet sich derart, dafl in der ersten ID die KR 
gestartet wird. Nach Ausfuhrung wird die Position des 
nicht ausgefuhrtenKW nach 2701 geschrieben, Sollte KR 
komplett ausgefiihrt worden. sein, wird das KR aus der 
verketteten FILMO-Liste entfernt, verbleibt aber im 
Speicher. Danach wird fiber, die FILMO-Liste zu dem 
nachsten KR gesprungen, das ebenso verarbeitet wird. 

Figur 28 verdeutlicht den Aufbau einer KR bei 
Mikrokontrollersteuerung. Zu Beginn steht ein 
Sprungbefehl, der hinter den Header (2801) der KR 
springt. Jedem KW zugeordnet ist das FILMO-Bit (2802). 
Eine 1 (2803) zeigt an, dafi das KW von den CEL 
akzeptiert wurde (ACCEPT) und beim nachsten Durchlauf 
nicht mehr ausgefiihrt wird. Eine 0 (2804) zeigt einen 
REJECT an, das KW mufl beim nachsten Durchlauf erneut 
ausgefiihrt werden. Die optionale KR-Statistik (2701) 
zeigt auf das erste mit 0 gekennzeichente KW. Erhalt 
PUSHRET (2805) einen REJECT, wird die Abarbeitung des KR. 
hier abgebrochen und beim. nachsten Durchlauf entweder . 
beim ersten KW oder an der Stelle auf die 2701 zeigt neu 
aufgesetzt. Ansonsten wird das KR an dessen Ende bei 
2806 ordentlich verlassen. 

Figur 29 zeigt die Schaltung zum Sichern der 
Statusinformationen einer CEL vor dem Durchlaufen des 
FILMOs oder Starten einer KR. Die Statusinf ormation 
gelangt aus der CEL (2901) auf ein Register (2902). Vor 
dem Durchlaufen des FILMOs oder Starten einer KR sendet 
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die CT ein Freigabesignal (2903) an 2902. Daraufhin wird 
die Statusinformation ubernommen und an die CT 
weitergeleitet (2904) . 2904 bleibt konstant bis zum 
nachsten Absenden von 2903; 
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Begrif f sdef inition 

ACCEPT Signal, das anzeigt, dafi die adressierte CEL 
sich in einem konf igurierbaren Zustand befindet und das 
gesendete KW annimmt. 

Block-Befehle (u. a. BLOCK-MOVE) Befehle, die eine 
Mehrzahl von Daten (einen Block) im Speicher oder 
zwischen Speicher und Peripherie verschieben. Dabei wird 
die Herkunftsadresse der zu verschiebenden Daten, die 
Zieladresse der Daten und die Lange das Datenblocks 
angeben. 

Broadcast Senden einer Information an eine Vielzahl 

von Empfangern. 

Datenempfanger Die Einheit (en) , die Ergebnisse der 

CEL weiterverarbeitet/-arbeiten 

Datensender Die Einheit (en) , die Daten fur die CEL 
als Operanden zur Verfiigung stellt/stellen 

Datenwort Ein Datenwort besteht aus einer beliebig 

langen Bit-Reihe. Diese Bit-Reihe stellt eine 
Verarbeitungseinheit fur eine Anlage dar. In einem 
Datenwort konnen sowohl Befehle fur Prozessoren o.a. 
Bausteinesowie rein Daten; kodiert werden. 

Deadlock Zustand, indem aufgrund gegenseitiger 

Blockade keinerlei Datenverarbeitung moglich ist. 

DFP Datenflufiprozessor nach Patent/Of fenlegung DE 

44 16 881 

DPGA Dynamisch konf igurierbare FPGAs . Stand der 

Technik 
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Eleraente Sammelbe griff fur a lie Art en yon in sich 

abgeschlossenen Einheiten, welche als Stuck in einem 
elektronischen Baustein zura Einsatz kommen konnen . 
. Elemente sind also: 

- Konfigurierbare Zellen aller Art 

- Cluster 

- RAM-B16cke 
Logik 

- Rechenwerke 

- Register 

- Multiplexer 

- I/O Pins eines Chips 

Ereignis Ein Ereignis kann durch ein 

Hardwareelement in irgendeiner zur Anwendung passenden 
Art und Weise ausgewertet werden und als Reaktion auf 
diese Auswertung eine bedingte Aktion ausldsen. 
Ereignisse sind somit zum Beispiel: 

- Taktzyklus einer Rechenanlage. 

- internes oder externes Interrupt-Signal. 

- Trigger-Signal von anderen Elementen innerhalb des 
Bausteines . 

- Vergleich eines Datenstroms und/oder eines 
Befehlstroms mit einem Wert. 

- Input/Output Ereigenisse. 

- Ablaufen, iiberlaufen, . neusetzen etc. eines Zahlers.. 

- Auswerten eines Vergleichs. 

FIFO First-In, First-Out Speicher nach dem Stand 

der Technik 

FILMO Abgewandeltes FIFO, aus dem linear Daten 
gelesen werden. Eine Beschrankung des Lesezeigers auf 
den Beginn des Speichers ist nicht vorhanden. 
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FPGA Programmierbarer Logikbaustein. Stand der 

Technik. 

F-PLUREG Register in dem die Funktion der CEL gesetzt 
wird. Ebenf alls wird der OneShot- und Sleep-Mode 
gesetzt. Das Register wird von der PLU beschrieben. 

Fragmentierung Zerteilen von Speicher in eine 

Vielzahl oftmals kleiner und damit nutzloser 
Speicherbereiche . 

Garbage-Kollektor Einheit zum Verwalten des Speichers . 
Verhindert eine Fragment ierung. 

H-Pegel Logisch 1 Pegel, abhangig von der verwendeten 
Technologie 

HOST Einem Baustein oder Baugruppe ubergeordneter 

Rechner . 



IDLE-Zyklus Zyklus, in dem eine Statemachine keine 
Verarbeitung durchfiihrt. Grundzustand einer 
Statemachine . 

INITER-CT-BUS Bussystem zwischen den CTs einer Ebene 
und einer hoherliegenden CT (oder CT-Gruppe) . 

INITIATOR CT, die einen Zugriff auf den Inter-CT- 

Bus startet. 

Pointer Zeiger auf eine Adresse bzw. ein 

Datenwort . 



kontigurierbares Element (KE) Ein konf igurierbares 

Element stellt eine Einheit eines Logik-Bausteines dar, 
welche durch ein Konf igurationswort fur eine spezielle 
Funktion eingestellt werden kann. Konf igurierbare 
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Elemente sind somit, alle Arten von RAM Zellen, 
Multiplexer, Arithmetische ldgische Einheiten, Register 
und alle Arten von interner und externer 
Verrie't zungsbeschreibung etc. }'• '.\ 

konfigurierbare Zelle (CEL) Siehe Logikzellen 

Konf igurieren Einstellen der Funktion und 

Vernetzung einer logischen Einheit, einer (FPGA) -Zelle 
oder einer CEL (vgl. umkonf igurieren) . . 

Konf igurationsdaten Beliebige Menge von 

Konf igurationsworten . 

Konfigurationsroutine (KR) Mehrere Konf igurationsworte 
zu einem Algorithmus zusammengefiigte . 

Konfigurationsspeicher Der Konf igurationspeicher 

enthalt ein oder mehrere Konf igurationsworte . 

Konfigurationswort (KW) Ein Konf igurationswort 

besteht aus einer beliebig langen Bit-Reihe. Diese Bit- 
Reihe stellt eine gultige Einstellung fur das zu 
konfigurierende Element dar, so das eine funktionsfahige 
Einheit entsteht. 

Ladelogik . Einheit zum Konf igurieren und 
Umkonf igurieren der CEL. Ausgestaltet durch einen 
speziell an seine Aufgabe angepafcten Mikrokontroller . 

Logikzellen Bei DFPs, FPGAs, DPGAs verwendete 
konfigurierbare Zellen, die einfache logische oder 
arithmetische Aufgaben gemafi ihrer Konf iguration 
erfullen. 
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Lookup-Tabelle Stand der Technik. Verf ahren zum 

Ubersetzen von Daten. 

LUT1 ":. Lookup-Tabelle, die einen Trigger auf eine ID : 
ubersetzt und feststellt, ob der Trigger einer -gultigen . 
ID zugeordnet ist. 

LUT2 Lookup-Tabelle, die eine ID auf die Adresse 

der entsprechenden KR im lokalen Speicher ubersetzt und 
feststellt, ob die KR im lokalen . Speicher vor ; handen ist. 

L-Pegel Logisch 0 Pegel, abhangig von der verwendeten . 
Technologie 

Maske Bitkombination, die die giiltigen Signale 
innerhalb einer Mehrzahl von Signalen angibt . 

Priorisierung Festlegung einer Reihenfolge. 
RECONFIG Rekonfigurierbarer Zustand einer CEL. 

RECONFIG-Trigger Setzen einer CEL in den 
rekonf igurierbaren Zustand. 

REJECT Signal, das anzeigt, dafi die adressierte CEL 
sich in einem nicht konf igurierbaren Zustand befindet 
und das gesendete KW nicht annimmt. 

REMOVE-<ID> 1. Befehl innerhalb eines KR zum 
Entfernen der durch ID ref erenzierten KR. 
2. Befehl einer ubergeordneten CT liber ein separates 
Interface Oder Handshaking an eine untergeordnete CT zum 
loschen der durch ID ref erenzierten KR. 

RESET Rucksetzen eines Bausteines oder eines ganzen 
Computersystems in einen definierten Grundzustand. 
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ROOT-CT . CT der hochsten Hierarchieebene mit ..direktem 
Zugriff auf den externen Konf igurationsspeicher . 

Round-Robin-Arbiter Arbiter der im Kreis lauft und 

inuner dem zuletzt arbitrierten Signal die niederste 
Prioritat zuordnet. 

Statemachine siehe Zustandsmaschine. 

Synchronisationssignale Statussignale die von einem 

konf igurierbaren Element oder einem Rechenwerk generiert 
werden und zur Steuerung und Synchronisation der 
Dateriverarbeitung an weitere konf igurierbare Element 
Oder Rechenwerke weitergeleitet werden. Es ist auch 
moglich ein Synchronisationssignal zeitlich verzogert 
(gespeichert) an ein und dasselbe konf igurierbare 
Element Oder Rechenwerk zuruckzuleiten . 

TARGET CT, die einen Ziel eines Zugriffs auf den 

Inter-CT-Bus ist. 

Trigger Synonym fur Synchronisationssignale. 

Umkonfigurieren Neues Konf igurieren von einer 
beliebigen Mengevon CELs wahrend eine beliebige 
■; Restmenge von CELs ihre eigeneh Funktionen f ortsetzen 
(vgl. konf igurieren) . 

Verkettete-Liste uber Pointer zusammengef ugte 
Datenstruktur nach dem Stand der Technik. 

Zellen Synonym fur konf igurierbare Elemente 

Zustandsmaschine Logik, die diversen Zustanden 

annehmen kann. Die Ubergange zwischen den Zustanden 
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sind von verschiedenen Eingangsparametern abhangig. 
Diese Maschinen werden zur Steuerung kpmplexer 
Funktionen eingesetzt und entsprechen dem Stand der 
Technik. '• • 
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Patent anspriiche 

1. Verfahren zuih Cachen von Befehlen in aus mehreren 
Re.chenwerken bestehenden Mikroprozes3oren und in 
Bausteinen mit zwei- oder v mehrdimensionaler 
Zellanordnung (z.B. FPGAs, DPGAs, DFPs, o.dgl.), dadurch 
gekennzeichnet, daB 

1.1 mehrere Zellen und . Rechenwerke (CEL) zu einer 

Mehrzahl von Gruppen zusanunengef aflt werden, 
wobei jeder Teilgruppe eine Cache-Einheit (CT) 
zugeordnet ist, 

1.2 die Cache-Einheiten der einzelnen Teil gruppen 

werden iiber eine Baumstruktur an eine 
ubergeordnete Cache-Einheit (ROOT-CT) 
geschaltet, die Zugriff auf den 
Befehlsspeicher Speicher (ECR) besitzt, in dem 
die Befehle abgelegt sind, 

1.3 Befehle werden zu Befehlssquenzen (KR) 

zusammengefafct, die immer als ganze gecachet 
und zwischen den Caches ubertragen werden, 

1.4 jede Cache-Einheit auf unterster oder mittlerer 

Ebene des Baumes fordert die benotigten 
Befehle bei der jeweils ubergeordneten Cache- 
Einheit an, 

1.5 eine ubergeordnete Cache-Einheit sendet eine 

angeforderten Befehlssequenzen an die 
untergeordnete Einheit, sofern sie die 
Befehlssequenzen in ihrem lokalen Speicher 
halt, 

1.6 eine ubergeordnete Cache-Einheit fordert eine 

angeforderten Befehlssequenzen bei der ihr 
ubergeordneten Cache-Einheit an, sofern sie 
die Befehlssequenzen nicht in ihrem lokalen 
Speicher halt, 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , 
daft 

Befehlssequenzen als Ganze geloscht werden. 

3. Verfahren nach. Anspruch. 1 bis 2, dadurch ... 
gekennzeichnet, daft 

Befehlssequenzen einer Cache-Einheit geloscht werden, 
wenn nicht genugend Platz zum Laden einer weiteren 
angeforderten. Bef ehlssequenz im lokalen Speicher 
vorhanden ist . 

4. Verfahren nach Anspruch 1 bis 2, dadurch 
gekennzeichnet, daft 

ein Befehl (REMOVE) innerhalb einer Bef ehlssequenz einen 
Vorgang auslost, durch den Befehlssequenzen einer Cache- 
Einheit geloscht werden. 

5. Verfahren nach Anspruch 1 bis 4, dadurch 
gekennzeichnet , daft 

ein Befehl (EXECUTE) innerhalb einer Bef ehlssequenz das 
Laden einer bestimmten kompletten Bef ehlssequenz 
auslost. 

6. Verfahren nach Anspruch 1 bis 5, dadurch 
gekennzeichnet , daft 

ein beliebiger Befehl (EXECUTE, REMOVE, etc.) uber eine 
Busverbindung zwischen den Caphe-Einheiten eine dent 
Befehl entsprechende Aktion auf einer bliebigen 
adressierten Cache-Einheit auslost . 

7. Verfahren nach Anspruch 1 bis 6, dadurch 
gekennzeichnet , daft 

eine Programmsequenz, die nicht effektive cachebar ist, 
da diese nur von einer Cache-Einheit verwendet wird, in 
kleine Teilsequenzen zerlegt wird, die von mehreren 
Cache-Einheiten benotigt werden, eine weitere 
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Teilsequenz (IKR) enthalt den nicht cachebaren Rest der 
Befehlssequenz und die Aufrufe der cachebaren 
Teiisequenzen. 

8. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafl 

jeder Befehlssequenz eine Statistik zugeordnet 1st, die 
Informationen Qber das Alter, d.h. der Verweildauer im 
Speicher der Cache-Einheit, der Befehlssequenz gibt. 

9. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafl 

jeder Befehlssequenz eine statistik zugeordnet ist, die 
Informationen liber die Haufigkeit der Aufrufe der 
Befehlssequenz gibt. 

10. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafl 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen uber die LMnge der Befehlssequenz gibt. 

U. Verfahren nach Anspruch 1 bis10, dadurch 
gekennzeichnet, dafl 

die Loschroutine so ausgelegt ist, dafl sie die Statistik 
Deder Befehlssequenz auswertet und die entsprechend des 
ausgefuhrten Algorithmuses unwichtigste Befehlssequenz 
entfernt . 

12. Verfahren nach Anspruch 1 bis 11, dadurch 
gekennzeichnet, dafl 

die Laschroutine an den auszufiihrenden Algorithmus 
programmierbar anpassbar ist. 
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